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这 本 书 源 于 2005 年 在 哥伦比亚 大 学 一 个 地 下 室 中 发 生 的 事情 。 那 
时 ， 我 还 是 一 名 研究 生 ， 正 在 为 最 终 的 毕业 论文 做 一 项 在 线 实验 。 有 
天 这 项 实验 的 学 术 部 分 我 将 在 第 4 章 进 行 介绍 ， 但 现在 ， 我 将 告诉 你 们 
一 件 我 的 毕业 论文 或 其 他 任何 论文 都 未 涉及 的 事情 。 这 件 事 从 根本 上 
改变 了 我 对 研究 的 看 法 。 一 天 早晨 ， 当 我 来 到 位 于 地 下 室 的 工作 室 
时 ， 我 发 现 一 夜 之 间 竟 有 约 100 个 来 自 巴西 的 人 参与 了 我 的 实验 。 这 一 
简单 的 经 历 对 我 产生 了 深远 的 影响 。 当 时 ， 我 的 几 个 朋友 正 醇 心 于 传 
统 的 实验 室 实验 。 我 知道 他 们 必须 很 费心 地 有 偿 召 集 并 指导 人 们 来 参 
与 实验 ， 如 有 果 一 天 能 有 10 个 人 完成 实验 ， 就 算是 不 错 的 进展 了 。 但 对 
我 的 在 线 实验 来 说 ， 我 在 睡觉 的 同时 ， 就 有 100 个 人 参与 了 实验 。 也 
许 ， 一 边 睡觉 一 边 做 研究 听 起 来 美好 得 令 人 难以 置信 ， 但 这 是 事实 。 
技术 的 变化 ， 尤 其 是 技术 从 模拟 时 代 到 数字 时 代 的 转弯， 意味 着 我 们 
可 以 用 新 的 方式 搜集 和 分 析 社 会 数据 。 这 本 书 束 是 天 于 如 何 利用 这 些 
新 方式 开展 社会 研究 的 。 


这 本 书 是 写 给 那些 “ 想 研 究 更 多 数据 科学 的 社会 科学 家 ”和 “ 想 
研究 更 多 社会 科学 的 数据 科学 家 ”以 及 对 这 两 个 领域 的 结合 感 兴趣 的 
人 人 的。 因此， 这 本 书 的 目标 受众 自然 束 不 仅 限 于 学 生 和 教授 了 。 尺 管 
我 目前 在 普林斯顿 大 学 任职 ， 但 之 前 也 在 政府 部 门 ( 美 国人 口 调查 局 
和 技术 产业 领域 的 微软 研究 院 ) 工作 过 ， 因 此 我 知道 ， 在 大 学 之 外 同 
样 存 在 着 很 多 令 人 兴奋 的 研究 。 因 此 ， 只 要 你 觉得 自己 正在 做 的 是 社 
会 研究 ， 那 么 无 论 在 何 处 就 职 或 使 用 何 种 技术 ， 你 都 可 以 参阅 此 书 。 


你 可 能 已 经 注意 到 了 ， 这 本 书 的 语言 风格 和 许多 其 他 的 学 术 著 作 
稍 有 不 同 。 这 其 实 是 我 特意 做 的 一 个 改变 。 这 本 书 的 部 分 内 容 源 于 我 
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(Computational Social Science) 研究 生 研 讨 班 ， 因 此 我 希望 它 能 
反映 这 个 研讨 班 的 一 些 活力 和 激情 。 具 体 而 言 ， 我 希望 这 本 书 能 够 具 
备 以 下 三 个 特点 : 有 帮助 的 、 面 同 未 来 的 以 及 乐观 的 。 


有 帮助 的 : 我 的 目标 是 写 一 本 对 你 们 有 帮助 的 书 。 因 此 ， 我 将 以 
坦诚 的 态度 、 非 正式 的 写作 风格 ， 通 过 实例 阐述 我 的 观点 。 我 最 想 传 
达 的 是 一 种 特定 的 思考 社会 研究 的 方式 ， 而 经 验 告诉 我 ， 传 达 这 一 思 
考 方式 的 最 好 的 方法 就 是 采取 非 正式 的 写作 风格 并 列举 大 量 例 子 。 此 
外 ， 在 本 书 的 参考 文献 中 ， 有 一 个 部 分 叫 “ 拓 展 阅 读 ”， 它 时 在 帮 你 
过 渡 到 有 关 我 所 介绍 的 多 个 主题 的 更 加 详细 、 更 加 专业 的 内 容 上 。 最 
后 ， 我 希望 此 书 能 对 你 们 自己 开展 研究 以 及 评估 别人 的 研究 有 所 玫 
助 。 


面向 未 来 的 : 我 希望 这 本 书 能 帮助 你 利用 现 有 的 以 及 未 来 将 出 现 
的 数字 系统 开展 社会 研究 。 我 是 从 2004 年 开始 做 这 类 研究 的 ， 这 期 间 
数字 系统 发 生 了 诸多 变化 ， 我 坚信 在 你 们 的 职业 生涯 中 ， 你 们 也 会 感 
受到 数字 系统 的 许多 变化 。 因 此 ， 要 想 让 这 本 书 “ 以 不 变 应 万 变 ”， 
就 要 做 到 “抽象 ”。 例 如 ， 这 本 书 不 会 教 你 如 何 使 用 现 有 的 推 特 应 用 
程序 界面 (Twitter API)〉， 相 反 ， 它 会 教 你 如 何 受 益 于 大 数据 资源 
(2H) 。 这 本 书 不 会 详细 告诉 你 如 何 利 用 亚 马 进 土耳其 机 器 人 
(Amazon Mechanical Turk， 以 下 简称 机 器 人 MTurk)〉 开展 实验 步骤 ， 
相反 ， 它 将 教 你 如 何 设计 和 解读 依赖 于 数字 时 代 基 础 设施 的 实验 (第 4 
Ht) 。 通 过 采用 这 种 抽象 化 的 手法 ， 我 希望 这 本 书 能 够 成 为 一 本 主题 
适时 、 经 得 起 时 间 考 验 的 书 。 


乐观 的 : 本 书 涉及 两 个 群体 一 一 社会 科学 家 和 数据 科学 家 ， 他 们 
有 看 截然 不 同 的 背景 和 兴趣 。 除 了 书 中 将 要 介绍 的 科学 方面 的 差异 以 
外 ， 我 还 友 现 ， 这 两 个 群体 看 待 事物 的 态度 也 是 不 同 的 。 数 据 科 学 家 
一 般 而 言 是 满怀 希望 的 ， 而 社会 科学 家 一 般 而 言 是 更 具 批 判 性 的 。 也 


就 是 说 ， 同 样 是 半 杯 水 ， 数 据 科学 家 看 到 的 是 还 有 半 杯 水 ， 而 社会 科 
学 家 看 到 的 则 是 杯子 有 一 半 已 经 空 了 。 在 本 书 中 ， 我 将 采取 数据 科学 
家 的 乐观 态度 。 因 此 ， 在 描述 相关 实例 时 ， 我 将 告诉 你 们 在 我 看 来 这 
些 例子 的 可 取 之 处 。 当 然 ， 鉴 于 没有 研究 是 完美 的 ， 我 也 会 指出 它们 
的 问题 所 在 ， 但 我 会 尽力 用 乐观 积极 的 方式 指出 。 我 不 会 为 批判 而 批 
判 ， 我 的 批判 是 为 了 能 让 你 们 设计 出 更 好 的 研究 。 


我 们 仍 处 于 数字 时 代 社 会 研究 的 早期 阶段 ， 但 我 已 经 及 现 了 一 些 
普遍 存在 的 误解 ， 它 们 的 普 裔 程度 让 我 觉得 有 必要 在 前 言 中 对 其 进行 
说 明 。 束 数据 科学 家 而 言 ， 我 及 现 他 们 有 两 个 第 见 的 误解 。 第 一 个 是 
认为 数据 越 多 越 有 利于 解决 问题 。 但 对 社会 研究 来 说 ， 我 的 经 验 告诉 
我 并 不 是 这 样 的 。 事 实 上 ， 对 社会 研究 来 说 ， 好 的 数据 似乎 要 比 更 多 
的 数据 更 有 和 帮助。 第 二 个 是 数据 科学 家 通常 认为 社会 科学 只 不 过 是 一 
堆 围 经 常识 的 花言巧语 村 了 。 当 然 ， 作 为 一 名 社会 科学 家 ， 更 确切 地 
说 是 社会 学 家 ， 我 不 同音 这样 的 观点 。 聪 明 的 人 长 期 以 来 一 二 在 努力 
理解 人 类 的 行为 ， 因 此 忽视 这 一 努力 所 取得 的 成 果 似 乎 是 不 明智 的 。 
我 希望 通过 这 本 书 ， 以 一 种 易于 理解 的 方式 和 你 们 分 至 其 中 的 一 些 成 
果 。 


就 社会 科学 家 而 言 ， 我 发 现 他 们 也 有 两 个 常见 的 误解 。 第 一 个 是 
有 些 社会 科学 家 会 因为 少数 不 真实 的 数据 而 彻底 否定 使 用 数字 时 代 的 
工具 开展 社会 研究 这 一 观念 。 如 末 你 正在 读 这 本 书 ， 那 你 可 能 已 经 读 
过 许多 平庸 地 或 错误 地 《或 两 种 方式 都 有 ) 使 用 社交 媒体 数据 的 论 
文 。 我 也 读 过 。 但 是 如 果 因 为 这 些 论文 就 得 出 结论 ， 说 数字 时 代 的 社 
会 研究 都 是 不 好 的 ， 这 将 是 一 个 严重 的 错误 。 事 实 上 ， 你 可 能 也 读 过 
许多 平庸 地 或 错误 地 使 用 调 碍 数据 的 论文 ， 但 你 并 没有 因此 而 否定 所 
有 使 用 调查 数据 的 论文 。 这 是 因为 你 知道 ， 也 有 使 用 调查 数据 并 且 做 
得 很 不 错 的 研究 。 而 我 将 通过 这 本 书 告诉 你 们 ， 使 用 数字 时 代 的 工具 
并 且 做 得 很 不 错 的 研究 也 是 有 的 。 


我 所 发 现 的 社会 科学 家 的 第 二 个 常见 误解 是 容易 将 现在 和 未 来 混 
消 。 当 我 们 对 数字 时 代 的 社会 研究 ， 即 我 在 本 书 中 将 探讨 的 研究 ， 进 
行 评 估 时 ， 思 考 以 下 两 个 截然 不 同 的 问题 至 关 重 要 : “这 类 研究 现在 
做 得 怎么 样 ” 以 及 “这 类 研 客 将 来 会 做 得 怎么 样 ”。 研 究 人 员 会 被 训 
练 来 回答 第 一 个 问题 ， 但 对 这 本 书 而 言 ， 我 认为 更 重要 的 是 第 二 个 问 
题 。 也 就 是 说 ， 尽 管 数字 时 代 的 社会 研究 尚未 做 出 巨大 的 、 改 变 范 式 
的 贡献 ， 但 数字 时 代 社 会 研究 的 进步 速度 快 得 怀 人 。 因 此 ， 相 比 于 其 
目前 的 发 展 水 平 ， 它 的 变化 速度 更 让 我 感到 兴奋 不 已 。 


尽管 上 一 段 似乎 是 在 告诉 你 们 ， 数 字 时 代 的 社会 研究 可 能 会 在 未 
来 的 某 个 时 间 变 得 相当 成 功 ， 但 我 的 目标 并 不 是 癌 你 们 推销 任何 特定 
类 型 的 研究 。 我 个 人 并 未 持 有 推 特 (Twitter ) 、 脸 谱 网 

(Facebook) 、 谷 歌 (Google) 、 微 软 (Microsoft) . FH 
(Apple) 或 其 他 任何 科技 公司 的 股份 。 但 是 ， 为 了 做 到 充分 披露 ， 我 
应 该 告诉 你 们 我 曾 在 微软 、 谷 歌 和 脸谱 网 工作 过 或 是 接受 过 其 研究 经 
费 和 赞助 。 因 此 ， 在 整 本 书 中 ， 我 的 目标 是 让 自己 做 一 个 可 信 的 叙述 
者 ， 告 诉 你 们 所 有 可 能 的 令 人 兴奋 不 已 的 新 事物 ， 同 时 引导 你 们 避 开 
一 些 我 曾 看 到 有 人 掉 进 去 的 陷阱 《有 的 我 自己 也 曾 抒 进去 过 ) 。 


社会 科学 和 数据 科学 的 交叉 学 科 有 时 会 被 称 为 “计算 社会 学 ”。 
有 些 人 认为 这 是 一 个 技术 领域 ,但 这 本 书 并 不 是 传统 意义 上 的 技术 图 
书 。 例 如 ， 这 本 书 的 正文 中 并 没有 公式 。 之 所 以 选择 这 样 的 方式 ， 是 
因为 我 想 呈 现 对 数字 时 代 社 会 研究 的 一 个 全 面 的 看 法 ， 其 中 包括 大 数 
据 资 源 、 调 但、 实验 、 大 规模 协作 和 道德 伦理 。 但 事实 证 明 ， 涵 盖 所 
有 这 些 主题 并 提供 每 个 主题 中 详细 的 技术 细 市 是 不 可 能 的 。 相 反 ， 我 
会 在 本 书 参考 文献 中 的 “拓展 阅读 ”里 推荐 更 多 的 技术 资料 。 换 句 话 
说 ， 这 本 书 不 是 为 了 教 你 如 何 做 条 种 特定 的 计算 ， 而 是 为 了 改变 你 对 
社会 研究 的 思考 方式 而 写 的 。 


如 何在 教学 中 使 用 这 本 书 ? 正如 前 面 所 述 ， 本 书 的 部 分 内 容 来 自 
我 从 2007 年 开始 在 普林斯顿 大 学 市 领 的 一 个 “计算 社会 学 ”研究 生 研 
讨 班 。 你 们 可 能 想 用 这 本 书 进行 教学 ， 所 以 我 觉得 有 必要 解释 一 下 我 
是 如 何 将 源 于 诬 党 的 素材 写成 这 本 书 的 ， 以 及 我 想象 的 这 本 书 在 其 他 
课 符 中 的 使 用 方式 。 


有 几 年 时 间 ， 我 上 课 是 没有 指定 教材 的 ， 我 只 是 给 学 生 指定 一 些 
文章 。 昌 然 他 们 能 够 从 这 些 文革 中 学 到 东西 ， 但 只 学 习 这 些 文章 还 不 
足以 让 他 们 发 生 我 所 期 竺 的 观念 转变 。 所 以 我 会 用 谍 闪 大 部 分 的 时 间 
讲述 这 些 文章 的 背景 ， 讲 述 应 该 采取 怎样 的 视角 以 及 给 予 他 们 建议 ， 
进而 帮助 学 生 获 得 更 全 面 的 认识 。 在 这 本 书 中 ， 我 试图 以 不 涉及 社会 
科学 或 数据 科学 专业 知识 的 方式 记录 上 述 所 有 的 背景 、 视 角 和 建议 。 


对 于 为 期 一 学 期 的 课程 ， 我 建议 将 这 本 书 与 其 他 各 种 阅读 材料 配 
套 使 用 。 例 如 ， 课 程 可 能 会 花 两 周 时 间 来 做 实验 ， 这 时 你 可 以 使 用 第 4 
章 的 内 容 ， 同 时 选取 诸如 以 下 主题 的 阅读 材料 : 预 处 理 信 息 在 实验 设 
计 和 分 析 中 的 作用 ; 在 公司 大 规模 的 A/B 测 试 过 程 中 所 浮现 出 来 的 统计 
和 计算 问题 ， 实 验 设计 ， 尤 其 是 原理 方面 ， 以 及 与 通过 机 器 人 MTurk 这 
样 的 在 线 荔 动力 市 场 招 码 实验 参与 者 相关 的 实践 、 科 学 和 伦理 方面 的 
问题 。 你 也 可 结合 编程 方面 的 阅读 材料 或 活动 。 至 于 如 何 从 这 些 材料 
中 选 出 合适 的 配套 材料 ， 残 取决 于 你 的 学 生 (是 本 科 、 研 究 生 还 是 博 
士 ) 以 及 他 们 的 背景 和 目标 。 


在 一 个 为 期 一 学 期 的 课程 中 ， 你 也 可 以 每 周 给 学 生 分 配 一 些 任 
务 。 这 本 书 的 每 一 草 都 会 涉及 各 种 各 样 的 “活动 ”， 我 将 把 “活动 ” 
放 在 参考 文献 中 ， 同 时 我 也 标注 了 它们 的 难度 等 级 ; 简单 SN, 
等 OV) 、 困 难 O 以 及 非常 困难 COM 。 此 外 ， 我 还 标注 了 每 个 问 
题 所 需 的 技能 : 数学 CD 、 编 码 CD) 以 及 数据 采集 SD . Eu, 
对 一 些 我 个 人 比较 喜欢 的 活动 ， 我 会 备注 心 形 图 标 ( 萝 ) . 我 希望 在 
这 么 多 的 任务 活动 中 ， 你 能 找到 适合 自己 的 。 


为 了 帮助 人 们 在 教学 中 使 用 这 本 书 ， 我 已 经 开始 搜集 相关 的 教学 
资料 了 ， 例 如 教学 大 纲 、 幻 灯 片 、 每 章 推 荐 的 配合 材料 以 及 一 些 任务 
活动 的 解决 方案 。 你 可 以 访问 http://www.bitbybitbook. com 查 看 或 完 
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2009 年 夏天 ， 手 机 铃声 响 遍 了 整个 卢旺达 。 除 了 来 自家 人 人、 朋友 
和 商业 伙伴 的 数 百 万 个 电话 之 外 ， 大 约 有 1000 名 户 旺 达 人 还 接 到 了 由 
乔 舒 亚 。 布 卢 门 斯 托 克 〈Joshua Blumenstock) 及 其 同事 打 来 的 电 
话 。 研 究 人 员 从 卢旺达 最 大 手机 供应 商 的 数据 库 中 随机 抽样 进行 调 
查 ， 以 完成 对 财富 与 贫困 的 研究 ， 这 个 数据 库 中 有 150 万 名 客户 。 布 卢 
门 斯 托 元 和 他 的 同事 会 询问 这 些 被 随机 选中 的 人 是 否 愿意 参与 调查 ， 
然后 向 其 解释 这 项 研究 的 性 质 ， 接 下 来 便 会 询问 一 系列 有 关 他 们 的 人 
口 学 特征 、 社 会 特征 和 经 济 特征 方面 的 问题 。 


到 目前 为 止 ， 我 所 描述 的 一 切 都 让 这 项 研究 听 起 来 像 是 一 项 传统 
的 社会 科学 调查 。 但 接 下 来 我 要 描述 的 就 不 再 传统 了 ， 人 至 少 目 前 来 说 
古 这 样 的 。 除 了 调查 而 来 的 数据 外 ， 布 卢 门 斯 托 元 和 同事 还 拥有 这 150 
万 人 的 完整 通话 记录 。 他 们 将 这 两 部 分 数据 结合 起 来 ， 利 用 调查 数据 
训练 了 一 个 机 器 学 习 模 型 ， 使 模型 能 根据 一 个 人 的 通话 记录 预测 其 财 
富 状 况 。 接 着 ， 他 们 利用 这 个 模型 评估 数据 库 中 150 万 名 客户 的 财富 状 
况 ， 还 利用 通话 记录 中 包含 的 地 理 信息 判断 这 150 万 名 客户 的 居住 位 
置 。 最 后 他 们 将 所 有 这 些 信息 一 一 估算 的 财 宦 状况 以 及 居住 位 置 ， 综 
合 到 一 起 ， 绘 制 出 高 分 辩 率 的 卢旺达 财富 地 理 分 布 图 。 尤 其 是 ， 他 们 
能 够 估算 出 卢旺达 2148 个 街区 《该 国 的 最 小 行政 单位 ) 中 每 一 个 街区 
的 财富 状况 。 


要 证 实 这 些 估算 是 不 可 能 的 ， 因 为 从 来 没有 人 估算 过 卢旺达 中 如 
此 小 的 地 理 区 域 的 财富 状况 。 但 在 布 户 门 斯 托 元 和 同事 把 这 些 估算 值 
汇总 为 分 别 反 映 户 旺 达 30 个 地 区 财富 状况 的 数值 后 ， 他 们 发 现 ， 这 些 
数值 与 通过 人 口 统计 和 健康 调查 (Demographic and Health Survey) 


得 到 的 数据 非常 接近 ， 而 人 口 统计 和 健康 调 碍 被 认为 是 发 展 中 国家 调 
得 的 黄金 标准 。 虽 然 这 两 种 方法 在 此 案例 中 产生 了 类 似 的 结果 ， 但 布 
户 门 斯 托 克 和 同事 的 方法 要 比 传统 的 人 口 统计 和 健康 调查 的 方法 快 了 
差不多 10 倍 ， 成 本 为 后 者 的 1/50 左 右 。 这 些 明 显 更 快 、 更 节省 成 本 的 
预测 为 研究 人 人员、 政府 和 公司 创造 了 新 的 可 能 性 (Blumenstock, 
Cadamuro, and On 2015) 。 


AA GD AS: 人 们 看 到 的 事物 取决 于 他 
们 的 背景 。 许 多 社会 科学 家 从 中 看 到 了 一 个 新 的 测量 工具 ， 这 个 工具 
可 以 检验 经 济 发 展 理论 。 许 多 数据 科学 家 从 中 看 到 了 一 个 很 酷 的 、 新 
的 机 器 学 习 问题 。 许 多 商界 人 士 看 到 了 一 个 可 以 让 他 们 从 已 经 搜集 到 
的 大 数据 中 获 利 的 好 方法 。 许 多 隐私 权 倡 导 者 从 中 看 到 了 一 个 可 怕 的 
警示 : 我 们 也 许 生活 在 一 个 大 规模 监控 的 时 代 。 最 后 ， 许 多 政策 制定 
者 从 中 看 到 了 新 技术 能 够 帮助 我 们 创造 一 个 更 好 的 世界 。 其 实 ， 这 项 
研究 与 这 些 都 相关 ， 而 且 正 是 因为 它 融合 了 这 么 多 特征 ， 所 以 我 把 它 
看 作 了 解 社会 研究 之 未 来 的 一 扇 窗 。 


1， 罗 夏 墨迹 测验 是 一 种 著名 的 人 格 测验 ， 它 会 向 被 试 呈现 由 墨迹 偶然 形成 的 图 案 ， 让 
被 试 观看 并 说 出 由 此 联想 到 的 事 ， 研 究 人 员 由 此 对 反应 符号 进行 分 析 ， 从 而 判断 被 试 的 
人 格 特征 。 一 一 编者 注 


1.2 欢迎 来 到 数字 时 代 


数字 时 代 无 处 不 在 ， 它 在 不 断 发 展 ， 并 且 改 变 着 研究 的 可 能 性 。 


这 本 书 的 核心 前 提 是 数字 时 代 能 为 社会 研究 创造 新 的 机 会 。 研 究 
人 员 现 在 能 以 不 久 前 还 几乎 不 可 能 的 方式 观察 行为 、 提 出 问题 、 开 展 
实验 以 及 彼此 协作 。 但 新 的 风险 也 随 之 而 来 研究 人 员 现在 能 以 过 去 
绝 不 可 能 的 方式 去 伤害 人 们 。 这 些 机 会 和 风险 源 于 从 模拟 时 代 到 数字 
时 代 的 转变 。 这 种 转变 并 不 是 像 开 灯 那 样 瞬间 就 发 生 了 ， 事 实 上 ， 这 
种 转变 目前 还 尚未 彻底 完成 。 但 目前 为 止 发 生 的 事情 ， 已 经 足以 让 我 
们 相信 有 大 事 正在 发 生 了 。 


注意 到 这 种 转变 的 一 个 方法 是 观察 发 现 你 们 日 常生 活 中 的 变化 。 
生活 中 ， 许 多 曾经 是 模拟 的 东西 现在 变 成 智能 的 了 。 也 许 你 曾经 用 的 
是 剖 胶 卷 的 相机 ， 但 现在 用 的 是 数码 相机 《可 能 你 们 的 智能 手机 就 有 
数码 相机 的 功能 ) 。 也 许 你 们 曾经 读 的 是 纸 质 的 报纸 ， 现 在 却 在 线 看 
新 闻 。 也 许 你 们 曾经 用 现金 来 付 球 ， 现 在 却 是 用 信用 卡 。 在 上 述 每 一 
种 情况 下 ， 从 模拟 到 数字 的 转变 ， 都 意味 着 更 多 关于 你 的 信息 被 以 数 
字 化 的 形式 获取 并 存储 了 下 来 。 


事实 上 ， 忌 体 来 看 ， 从 模拟 到 数字 的 转变 所 产生 的 影响 是 非 第 惊 
人 的 。 信 息 量 正在 迅速 增加 ， 更 多 的 信息 以 数字 化 的 形式 被 存储 ， 进 
而 便于 分 析 、 传 输 和 归并 。 这 些 数字 信息 被 称 为 “大 数据 ”。 在 数字 
数据 爆炸 式 增长 的 同时 ， 有 条 件 使 用 计算 机 的 人 的 数量 也 在 不 断 增加 
〈 图 1. 1) 。 这 些 趋势 ， 即 越 来 越 多 的 数字 数据 以 及 越 来 越 多 的 使 用 计 
算 机 的 人 ， 在 可 预见 的 未 来 很 可 能 会 持续 下 去 。 


(10 亿 吉 字 节 ) 信息 在 储 
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图 1.1 信息 存储 能 力 和 计算 能 力 正 在 显著 提高 。 此 外 ， 信 息 存储 现在 几乎 已 经 全 部 
数字 化 了 。 这 些 变 化 为 社会 研究 人 员 创 造 了 不 可 思议 的 机 会 。 改 编 自 Hilbert and 
López (2011) o 

考虑 到 社会 研究 的 目的 ， 我 认为 数字 时 代 最 重要 的 特征 就 是 计算 
机 随处 可 见 。 从 最 初 房间 般 大 的 、 只 有 政府 和 大 公司 才能 使 用 的 计算 
机 发 展 而 来 ， 今 天 的 计算 机 ， 其 尺寸 在 不 断 缩小 ， 普 及 程度 在 不 断 增 
加 。 从 20 志 纪 80 年 代 开 始 ， 每 10 年 就 会 有 一 种 新 型 的 计算 机 诞生 : 个 
人 人 计算机、 笔记 本 电脑 、 智 能 手机 以 及 现在 “ 物 联网 ”中 的 舱 入 式 处 
理 器 《〈 即 汽车 、 手 表 和 恒温 器 等 设备 内 部 的 能 入 式 计算 机 ) (Waldrop 
2016) 。 除 了 计算 ， 这些 随处 可 见 的 计算 机 还 开始 具备 越 来 越 多 的 功 
能 : 感知 、 存 储 和 传输 信息 。 


对 研究 人 员 来 说 ， 利 用 网 络 最 容易 看 出 随处 可 见 的 计算 机 所 产生 
的 影响 。 互 联网 是 一 个 被 全 面 监测 的 环境 ， 非 常 适合 研究 人 员 开 展 实 
验 。 例 如 ， 一 个 网 上 商店 很 容易 束 可 以 搜集 到 精确 的 数 百 万 顾客 的 购 
买 行为 数据 。 然 后 ， 它 可 以 随机 选择 几 组 顾客 并 为 其 提供 不 同 的 购物 
体验 。 这 种 在 精准 掌握 了 顾客 购物 数据 的 基础 上 再 进行 随机 选择 的 能 
力 ， 意 味 着 网 上 商店 能 够 持续 开展 随机 对 照 实验 。 事 实 上 ， 只 要 曾 在 
网 上 买 过 东西 ， 你 的 购买 行为 就 已 经 被 记录 下 来 了 ， 之 后 你 也 几乎 必 
然 地 会 成 为 条 项 实验 的 参与 者 ， 无 论 你 自己 是 人 否 知 道 。 


这 种 被 全 面 监测 、 完 全 随机 化 的 情况 不 仪 局 限于 网 上 ， 这 在 线 下 
也 开始 变 得 越 来 越 普 裔 。 实 体 店 已 经 搜集 了 非常 详细 的 购买 行为 数 
据 ， 同 时 它们 也 正在 开发 相关 基础 设施 ， 以 便 退 踪 顾 客 的 购买 行为 ， 
并 将 实验 研究 结果 用 于 日 常 商 业 活 动 中 。“ 物 联网 ”意味 着 现实 世界 


中 的 行为 会 越 来 越 多 地 被 数字 传 感 占 捕获 。 换 句 话 说 就 是 ， 当 你 思考 
数字 时 代 的 社会 研究 时 ， 你 不 应 该 只 想到 “在 线 ” 社 会 研究 ， 你 应 该 
想到 它 可 以 发 生 在 任何 地 方 。 


数字 时 代 使 行为 测量 和 实施 随机 化 的 处 理 成 为 可 能 ， 同 时 还 为 人 
们 创造 了 新 的 交流 途径 。 这 些 新 的 交流 途径 使 研究 人 员 能 够 开展 创新 
性 的 调查 ， 并 与 同事 以 及 普通 大 众 进行 大 规模 协作 。 


怀疑 论 者 可 能 会 说 ， 上 述 这 些 功 能 并 不 能 算是 真正 意义 上 的 新 事 
物 。 也 就 是 说 ， 在 过 去 ， 人 们 的 交流 途径 也 曾 有 过 其 他 一 些 重大 的 进 
步 ， 例 如 电报 (Gleick 2011) ， 而 且 自 20 世 纪 60 年 代 以 来 ， 计 算 机 的 
运行 速度 也 基本 上 一 直 在 以 同样 的 速度 增长 (Waldrop 2016) 。 但 这 
些 怀疑 论 者 所 忽略 的 是 ， 在 某 种 程度 上 ， 多 个 相同 的 东西 合 起 来 会 变 
成 一 个 不 同 的 东西 (Halevy，Norvig，and Pereira 2009) 。 让 我 用 
我 喜欢 的 一 个 类 比 来 曾 明 这 一 观点 : 如 果 你 能 捕捉 到 一 匹 马 在 某 一 刻 
的 画面 ， 你 便 拥 有 了 一 张 照片 ;而 如 果 你 在 一 秒 内 捕捉 到 一 匹 马 的 24 
个 画面 ， 那 么 你 便 拥 有 了 一 部 电影 的 请 段 。 当 然 ， 一 部 电影 其 实 束 是 
许多 张 照 片 ， 但 只 有 驳回 的 怀疑 论 者 才 会 坚持 声称 照 斤 和 电影 完全 一 
样 。 


研究 人 员 正 在 进行 一 项 类 似 于 从 摄影 到 拍 电影 的 转变 ， 但 这 一 转 
变 并 不 代表 我 们 过 去 所 学 的 所 有 东西 都 应 该 个 握 弃 。 正 如 摄影 的 原理 
会 影响 拍 电 影 的 原理 一 样 ， 那 些 在 过 去 100 年 里 发 展 起 来 的 社会 研究 理 
论 也 会 对 未 来 100 年 的 社会 研究 产生 影响 。 这 一 转变 意味 着 我 们 不 应 该 
一 直 做 同样 的 事情 。 相 反 ， 我 们 必须 把 过 去 的 、 现 在 的 以 及 未 来 的 方 
法 结合 起 来 。 例 如 ， 天 和 舒 亚 。 布 户 门 斯 托 元 和 同事 所 做 的 研究 就 结合 
了 传统 的 调查 研究 和 一 些 人 可 能 称 之 为 数据 科学 的 方法 。 单 赁 调查 研 
完 或 是 单 任 通话 记录 部 无 法 绘制 出 高 分 辨 率 的 反映 财富 估 值 的 地 图 ， 
这 两 个 是 缺 一 不 可 的 。 更 概括 地 说 ， 社 会 研究 人 员 需 要 将 社会 科学 和 


数据 科学 的 思想 结 
其 一 是 不 够 的 。 


合 起 来 ， 才 能 充分 利用 数字 时 代 带 来 的 机 会 


Ra 


if 


Tr 


1.3 研究 设计 


研究 设计 是 将 问题 和 答案 联系 起 来 。 


本 书 是 为 两 个 群体 所 写 的 ， 这 两 个 群体 有 很 多 需要 互相 学 习 的 地 
方 。 一 方面 ， 这 本 书 是 写 给 社会 科学 家 的 ， 他 们 接受 过 社会 行为 研究 
方面 的 训练 ， 也 有 这 方面 的 经 验 ， 但 对 数字 时 代 所 带 来 的 机 会 不 是 很 
熟悉 。 为 一 方面 ， 这 本 书 是 写 给 那些 能 得 心 应 手 地 使 用 数字 时 代 工 
具 ， 但 对 社会 行为 研究 来 说 是 新 手 的 研究 人 员 的 。 这 类 研究 人 员 不 愿 
被 冠 以 一 个 简单 的 称谓 ， 但 我 将 把 他 们 称 为 数据 科学 家 。 这 些 数据 科 
学 家 经 常会 接受 计算 机 科学 、 统 计 学 、 信 息 科 学 、 工 程 学 和 物理 学 等 
方面 的 训练 ， 已 成 为 最 早 开展 数字 时 代 社 会 研究 的 一 群 人 ， 这 部 分 是 
因为 他 们 能 够 获得 必要 的 数据 ， 同 时 也 具备 相应 的 计算 能 力 。 本 书 试 
图 让 这 两 个 群体 彼此 合作 ， 进 而 创造 出 比 单独 一 个 群体 所 能 创造 的 更 
加 丰富 、 更 加 有 趣 的 东西 。 


要 实现 这 一 强 有 力 的 合作 ， 最 好 的 方式 不 是 专注 于 抽象 的 社会 理 
论 或 是 花哨 的 机 器 学 习 。 最 好 的 起 点 是 研究 设计 。 如 果 你 将 社会 研 完 
看 作 询 问 和 回答 有 关 人 类 行为 问题 的 过 程 ， 那 么 研究 设计 就 是 “结缔 
组 织 ”， 它 能 将 问题 和 答案 联系 起 来 。 而 建立 正确 的 联系 是 设计 出 令 
人 信服 的 研究 的 关键 。 本 书 将 重点 介绍 4 种 方法 : 观察 行为 、 提 问 、 开 
展 实验 以 及 与 他 人 合作 。 这 些 方法 你 之 前 应 该 已 经 见 过 或 可 能 用 过 ， 
但 特别 之 处 在 于 ， 数 字 时 代为 我 们 禹 来 了 新 的 搜集 和 分 析 数 据 的 机 
会 。 这 些 新 机 会 要 求 我 们 将 这 些 经 典 的 方法 现代 化 ， 但 不 是 要 取代 这 
KETTE: 


1.4 本 书 的 主题 


本 书 的 两 个 主题 分 别 是 : (1) 将 现成 品 和 定制 物 结合 起 来 ; 
(2) 道德 伦理 。 


这 两 个 主题 将 贯 罕 整 本 书 ， 我 之 所 以 在 这 里 强调 它们 ， 是 为 了 让 
你 们 在 其 反复 出 现时 能 够 注意 到 。 第 一 个 主题 可 以 通过 对 比 马 塞 尔 。 
Hi (Marcel Duchamp) 和 米 开 明 琪 罗 (Michelangelo) 这 两 位 伟人 
TRA. FLT EB EAA TRY kh AAR VE ie Malin (aR) ) 而 闻 
名 ， 这 些 艺 术 作 品 都 是 普通 物品 经 他 稍 做 修改 而 创造 出 来 的 。 而 米 开 
明 琪 罗 则 不 是 通过 修改 现成 品 进行 创作 的 。 当 他 想 创 作 一 章 大 卫 的 雕 
像 时 ， 他 并 没有 去 寻找 一 块 看 起 来 像 大 卫 的 大 理 石 ， 而 是 花 了 三 年 的 
时 间 司 刻 出 了 他 的 杰作 。 因 此 ，《 大 卫 》 不 是 一 个 现成 品 艺术 作品 ， 
而 是 一 个 非 现 成 曲艺 术 作 品 《〈 图 1.2) 。 


这 两 种 风格 一 一 现成 品 艺术 作品 和 非 现成 品 艺术 作品 ， 大 致 可 以 
映射 出 数字 时 代 的 社会 研究 所 采用 的 风格 。 正 如 你 们 将 要 看 到 的 ， 本 
书 中 的 一 些 例 子 束 涉 及 对 某 些 大 数据 资源 的 巧妙 的 重新 配置 ， 而 这 些 
大 数据 资源 最 初 是 由 公司 或 政府 所 创建 的 。 在 其 他 例子 中 ， 研 究 人 员 
则 从 一 个 特定 的 问题 出 发 ， 然 后 使 用 数字 化 工具 创建 出 回答 该 问题 所 
需 的 数据 。 如 果 做 得 好 的 话 ， 这 两 种 模式 都 非常 强大 。 因 此 ， 数 字 时 
代 的 社会 研究 将 既 包 括 现成 品 作品 又 包括 非 现 成 品 作品 ， 既 包括 杜 尚 
又 包括 米 开 明 琪 罗 。 


如 果 你 们 通常 使 用 的 古 现成 数据 ， 那 么 我 希望 这 本 书 能 告诉 你 们 
非 现成 数据 的 价值 。 同 样 ， 如 果 你 们 通常 使 用 的 是 非 现 成 数据 ， 那 么 
我 希望 这 本 书 能 告诉 你 们 现成 数据 的 价值 。 最 后 ， 也 是 最 重要 的 ,我 
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亚 ，。 布 户 门 斯 托 克 及 其 同事 就 是 杜 尚 和 米 开朗 琪 罗 的 结合 体 : 他 们 把 
通话 内 容 录 首 〈 一 个 现成 数据 ， 用 于 不 同 的 用 途 ， 同 时 又 创建 了 自己 
的 调查 数据 《〈 一 个 非 现 成 数据 ) 。 在 整 本 书 中 ， 你 们 都 将 看 到 现成 品 
与 非 现成 品 的 结合 ， 这 种 结合 往往 既 需要 社会 科学 的 思想 也 需要 数据 
科学 的 思想 ， 并 且 这 种 络 合 冲冲 会 带 来 最 令 人 兴奋 的 研究 。 


现成 品 艺 术 作品 非 现 成 品 艺术 作品 
图 1.2 马 塞 尔 。 杜 尚 的 《和 泉 》 和 米 开 朗 琪 罗 的 《大 卫 》。《 泉 》 就 是 一 件 现成 品 艺 
术 作品 ， 这 类 作品 是 艺术 家 对 现实 世界 中 已 经 存在 的 东西 进行 创造 性 加 工 修改 后 而 
产生 的 艺术 品 。 而 《大 卫 》 则 是 有 意 创 造 的 艺术 品 ， 是 一 件 非 现成 品 艺 术 作 品 。 数 
字 时 代 的 社会 研究 将 既 包 括 现 成 品 作品 又 包括 非 现 成 品 作 品 。《 泉 》 由 艾 尔 弗 雷 德 
HERAN (Alfred Stieglitz) 摄 于 1917 年 〈 来 源 : The Blind Man, 
no. 2/Wikimedia Commons) 。《 大 卫 》 由 约 尔 格 。 比 特 纳 。 丛 纳 (Jörg Bittner 
Unna) 摄 于 2008 年 (来 源 : Galleria dell’ Accademia, Florence/Wikimedia 
Commons) 。 


贯穿 本 书 的 第 二 个 主题 是 道德 伦理 。 我 将 告诉 你 们 ， 研 究 人 员 如 
何 利用 数字 时 代 的 机 会 开展 令 人 兴奋 且 意 义 重大 的 实验 。 同 时 我 也 将 
告诉 你 们 ， 利 用 这 些 机 会 的 研究 人 员 将 如 何 做 出 艰难 的 伦理 决策 。 本 


书 第 6 章 全 部 是 关于 道德 伦理 的 ， 但 其 他 章节 也 会 涉及 这 一 话题 ， 因 为 
在 数字 时 代 ， 道 德 伦理 将 成 为 研究 设计 中 越 来 越 重要 的 一 个 部 分 。 


布 卢 门 斯 托 克 及 同事 的 实验 可 以 再 次 被 用 来 证 明 这 一 点 。150 万 人 
的 通话 记录 为 他 们 的 研究 创造 了 很 好 的 机 会 ， 但 同时 也 提供 了 造成 伤 
害 的 机 会 。 例 如 ， 乔 纳 森 。 迈 耶 〈Jonathan Mayer) 及 同事 在 2016 年 
己 经 表明 ， 即 使 是 对 “匿名 化 ”的 通话 内 容 录 音 〈 即 没有 名 字 和 地 址 
的 数据 ) ， 在 结合 公开 信息 后 ， 研 究 人 员 也 可 能 从 中 识别 出 属于 某 些 
特定 人 员 的 通话 内 容 ， 进 而 推断 出 有 关 他 们 的 敏感 信息 ， 例 如 某 些 健 
康 状 况 的 信息 。 也 就 是 说 ， 虽 然 布 卢 门 斯 托 元 及 同事 并 未 试图 找 出 某 
些 特定 的 人 并 推断 有 关 他 们 的 敏感 信息 ， 但 这 一 可 能 性 会 让 他 们 很 难 
拿 到 通话 数据 ， 这 迫使 他 们 在 进行 研究 时 要 采取 全 面 的 保护 措施 。 


除了 详细 的 通话 记录 以 外 ， 数 字 时 代 的 许多 社会 研究 中 都 存在 一 
个 让 人 很 不 安 的 根本 性 问题 : 研究 人 员 《〈 经 种 与 公司 和 政府 合作 ) 对 
实验 参与 者 的 生活 拥有 越 来 越 强 的 控制 力 。 我 所 说 的 控制 力 古 指 在 未 
征 得 参与 者 同意 ， 甚 至 在 他 们 不 知情 的 情况 下 ， 对 他 们 做 一 些 事情 的 
能 力 。 例 如 ， 研 究 人 员 现在 可 以 观察 数 百 万 人 的 行为 ， 而 且 正 如 我 后 
文 将 描述 的 ， 研 究 人 员 也 可 以 让 数 百 万 人 参加 大 规模 的 实验 。 所 有 这 
些 事情 都 可 能 在 未 征 得 当事人 同意 或 其 不 知情 的 情况 下 进行 。 研 究 人 
员 的 控制 力 在 不 断 增强 ， 对 如 何 使 用 这 一 控制 力 的 规范 却 没有 相应 地 
变 得 更 加 明确 。 也 束 是 说 ， 研 究 人 员 必 须 在 彼此 不 一 至、 相互 重 县 的 
法 律 法 规 的 基础 上 决定 他 们 该 如 何 行使 这 一 控制 力 。 因 此 ， 即 便 是 痰 
意 的 研究 人 员 ， 在 面 对 强 大 的 控制 力 和 模糊 的 指导 方针 时 ， 可 能 也 会 
被 迫 去 做 一 些 艰 难 的 抉择 。 


如 果 你 们 通 第 关注 的 是 数字 时 代 的 社会 研究 所 创造 的 新 机 会 ， 那 
么 我 希望 这 本 书 能 让 你 们 明白 这 些 机 会 也 会 带 来 新 的 风险 。 同 样 ， 如 
果 你 们 通常 关注 的 是 这 些 风险 ， 那 么 我 希望 这 本 书 能 帮助 你 们 发 现 新 
机 会 (需要 冒险 的 机 会 )。 最 后 ， 同 时 也 是 最 重要 的 ， 我 希望 这 本 书 


能 帮助 大 家 负责 任 地 平衡 数字 时 代 的 社会 研究 所 带 来 的 机 会 和 风险 。 
当 研究 人 员 开 始 拥 有 更 强 的 控制 力 时 ， 他 们 也 必须 承担 更 大 的 社会 黄 
> 


2.5 结论 


大 数据 资源 无 处 不 在 ， 但 利用 它们 进行 社会 研究 可 能 会 遇 到 很 多 
问题 。 根 据 我 的 经 验 ，“ 天 上 不 会 摊 饮 饼 ” 这 类 规则 也 适用 于 社会 研 
完 的 数据 : 如 果 你 不 投入 大 量 工作 来 搜集 数据 ， 那 么 你 可 能 需要 投入 
大 量 工作 去 思考 和 分 析 数 据 。 


今天 的 大 数据 资源 往往 具有 以 下 10 个 特征 ， 未 来 的 大 数据 资源 也 
可 能 如 此 。 其 中 有 3 个 特征 通常 是 (但 并 不 总 是 ) 有 助 于 研究 的 : 海量 
性 、 持 续 性 以 及 不 反应 性 。 而 其 余 7 个 则 通常 是 (但 并 不 总 是 ) 不 利于 
研究 的 : 不 完整 性 、 难 以 获取 、 不 具 代 表 性 、 漂 移 、 算 法 干扰 、 脏 数 
据 以 及 敏感 性 。 其 中 许多 特征 之 所 以 会 出 现 ， 是 因为 大 数据 资源 并 不 
是 为 了 社会 研究 而 创建 的 。 


基于 本 章 的 观点 ， 我 认为 以 下 三 点 最 能 说 明 大 数据 资源 在 社会 研 
究 中 的 价值 。 首 先 ， 大 数据 资源 能 让 研究 人 员 验 证 两 个 互相 矛盾 的 理 
论 预测 的 正 误 ， 比 如 法 伯 的 纽约 市 出 租车 司机 研究 。 其 次 ， 基 于 大 数 
所 资源 的 临近 预测 能 为 决策 者 提供 更 好 的 评估 信息 ， 该 类 研究 的 一 个 
事例 是 金 斯 伯 格 等 人 的 谷歌 流感 趋势 研究 。 最 后 ， 大 数据 资源 有 助 于 
研究 人 员 在 不 开展 实验 的 情况 下 进行 因果 推 朵 ， 该 类 研究 的 事例 包括 
马 斯 和 英 雷 蒂 针 对 同 信 效 应 对 生产 力 影 响 的 研究 以 及 埃 纳 维 等 人 针对 
易 贝 上 起 担 价 对 拍卖 影响 的 研究 。 然 而 ， 无 论 是 上 述 哪 一 种 情形 ， 都 
需要 研究 人 员 赋 予 数据 更 多 东西 ， 例 如 确定 对 因果 推断 很 重要 的 研究 
定量 或 两 个 观点 互相 矛盾 的 理论 。 因 此 ， 我 认为 对 大 数据 资源 的 作用 
的 最 好 描述 是 ， 它 们 能 够 帮助 那些 可 以 提出 有 趣 且 重要 问题 的 研究 人 


lo 


本 章 结 束 之 前 ， 我 认为 还 有 一 个 问题 值得 思考 ， 那 就 是 大 数据 资 
源 可 能 对 数据 和 理论 之 间 的 关系 产生 重要 的 影响 。 目 前 为 止 ， 本 章 所 
采用 的 方法 是 理论 导向 的 实证 研究 。 但 大 数据 资源 也 能 让 研究 人 员 进 
行 实证 导 同 的 理论 推理 。 也 就 是 说 ， 通 过 仔细 积累 经 验 事 实 、 实 际 模 
式 和 难 解 之 题 ， 研 究 人 员 可 以 建立 新 的 理论 。 这 一 非 传 统 的 、 在 没有 
理论 假设 的 情况 下 直接 从 数据 入 手 建立 理论 的 方法 并 非 是 首次 被 提 
RB, Fe + 格拉 泽 (Barney Glaser) 和 安 塞 尔 姆 。 施 特 劳 斯 (Anselm 
Strauss) 在 其 提倡 扎根 理论 的 著作 中 就 对 这 一 方法 进行 了 最 有 力 的 阁 
述 。 但 这 种 直接 从 数据 入 手 的 方法 并 没有 像 数 字 时 代 的 一 些 有 关 研 究 
的 文章 所 宣称 的 那样 意味 着 “理论 的 终结 ” (Anderson 2008) 。 相 
反 ， 随 着 数据 环境 的 变化 ， 我 们 应 该 期 望 数据 和 理论 的 关系 能 重新 得 
到 平衡 。 在 过 去 ， 数 据 采 集 是 很 昂贵 的 ， 因 此 只 搜集 那些 理论 表明 最 
有 用 的 数据 是 说 得 通 的 。 但 现在 ， 我 们 有 海量 的 可 以 免费 使 用 的 数 
据 ， 因 此 除了 搜集 最 有 用 的 数据 以 外 ， 尝 试 直接 从 现 有 数据 入 手 也 是 
可 以 的 (Goldberg 2015) o 


本 章 内 容 表 明 ， 研 究 人 员 通 过 观察 人 类 可 以 了 解 到 很 多 东西 。 在 
接 下 来 的 几 章 中 ， 我 将 介绍 如 何 通过 调整 数据 采集 的 方法 ， 通 过 提问 
第 3 章 ) 、 开 展 实验 (第 4 章 ) ， 甚 至 直接 选择 一 部 分 人 参与 研究 过 
Be (Oe) 这 些 与 人 们 更 直接 的 互动 了 解 更 多 不 同 的 东西 。 


第 3 章 del 


3.1 简介 


因为 不 能 问 海豚 问题 ， 所 以 关注 海豚 的 研究 人 员 不 得 不 通过 观察 
其 行为 的 方式 来 了 解 这 一 物种 。 而 研究 人 类 则 相对 容易 一 些 ， 因 为 人 
类 会 说 话 。 与 人 交谈 在 过 去 是 社会 研究 的 一 个 重要 组 成 部 分 ， 我 希望 
将 来 也 是 如 此 。 


在 社会 研究 中 ， 与 人 交谈 通常 有 两 种 形式 : 调查 和 深度 访谈 。 简 
单 来 说 ， 通 过 调 碍 进行 的 研究 需要 系统 地 招募 大 量 参与 者 ， 需 要 高 度 
结构 化 的 调查 问卷 以 及 使 用 统计 方法 实现 从 参与 者 到 更 大 群体 的 谤 
化 。 而 通过 深度 访谈 进行 的 研究 则 通 音 需 要 少量 的 参与 者 和 半 结 构 化 
的 对 话 ， 最 终 得 出 关于 参与 者 的 丰富 的 定性 插 述 。 调 查 和 深度 访谈 都 
征 很 有 效 的 方法 ， 但 从 模拟 时 代 到 数字 时 代 的 转变 对 调查 的 影响 更 
大 。 因 此 ， 在 本 章 中 ， 我 将 重点 介绍 调查 研究 。 


本 章 将 向 大 家 展示 ， 数 字 时 代为 调查 研究 人 员 创 造 了 许多 令 人 兴 
奋 的 机 会 ， 使 他 们 能 以 更 快 的 速度 、 更 低 的 成 本 搜集 数据 ， 能 提出 不 
同类 型 的 问题 ， 并 能 利用 大 数据 资源 放大 调 碍 数据 的 价值 。 技 术 变 单 
可 以 改变 调查 研究 已 经 不 是 新 鲜 事 了 了。 大约 在 1970 年 ， 电 话 这 一 新 通 
信 技 术 的 诞生 也 引发 了 一 场 类 似 的 变革 。 幸 运 的 是 ， 理 解 电话 如 何 改 
变调 查 研究 有 助 于 我 们 预测 数字 时 代 将 如 何 改变 调查 研究 。 


今天 我 们 所 认可 的 调查 研究 起 源 于 20 世 纪 30 年 代 。 在 调查 研究 的 
第 一 个 时 代 ， 研 究 人 员 会 随机 选取 地 理 区 域 (如 城市 街区 〉 ， 然 后 前 
往 这 些 地 区 ， 与 随机 选取 的 住户 进行 面对面 的 交谈 。 之 后 ， 固 定 电话 
开始 在 一 些 富 裕 国 家 大 量 涌现 ， 这 一 技术 发 展 最 终 促使 调查 研究 进入 
了 第 二 个 时 代 。 在 该 时 代 ， 无 论 是 人 们 被 选 为 样本 的 方式 还 是 对 话 发 


生 的 方式 都 发 生 了 改变 。 研 究 人 员 不 再 选取 茶 地 理 区 域 的 住户 作为 样 
本 ， 而 是 通过 一 个 随机 拨号 的 程序 随机 选取 电话 号 码 作 为 样本 。 他 们 
也 不 再 前 往 当地 和 人 们 面对面 交谈 了 ， 而 是 通过 打 电 话 来 交流 。 这 些 
看 似 很 小 的 组 织 实施 上 的 变化 却 让 调查 研究 变 得 更 快 、 成 本 更 低 、 更 
加 灵活 。 除 了 这 些 益 处 之 外 ， 这 些 变 化 也 引发 了 争议 ， 因 为 许多 研究 
人 员 担 心 这 些 取 样 和 访谈 方式 的 改变 会 导致 各 种 偏差 。 但 最 终 ， 在 大 
量 工作 之 后 ， 研 究 人 员 找 到 了 通过 随机 拨号 和 电话 访谈 搜集 可 靠 数 据 
的 方法 。 因 此 ， 成 功 借助 了 社会 上 的 技术 基础 设施 ， 研 究 人 员 能 以 现 
代 化 的 方式 进行 调查 研究 了 。 


现在 ， 男 一 项 技术 发 展 一 一 数字 技术 ， 最 终 将 带领 我 们 进入 调查 
研究 的 第 三 个 时 代 。 这 一 转变 的 部 分 原因 是 第 二 个 时 代 的 方法 逐渐 不 
再 适用 了 (Meyer, Mok, and Sullivan 2015) 。 例 如 ， 由 于 各 种 技术 
和 社会 原因 ， 多 年 来 无 回答 率 〈 即 样本 中 未 参与 调查 的 受 访 者 的 比 
例 ) 一 直 在 上 升 (National Research Council 2013) 。 这 一 长 期 趋 
势 意 味 着 ， 如 果 现 在 开展 电话 调查 ， 那 么 无 回答 率 会 超过 90%。 


劝 一 方面 ， 回 第 三 个 时 代 的 过 湾 在 部 分 程度 上 也 受到 了 令 人 兴 
的 新 机 会 的 推动 ， 我 将 在 本 章 对 其 中 一 些 机 会 进行 描述 。 尽 管 目前 还 
没有 定论 ， 但 我 预计 非 概率 抽样 、 计 算 机 管理 的 调查 以 及 使 用 大 数据 
资源 进行 调查 ， 将 成 为 调查 研究 第 三 个 时 代 的 特征 〈 表 3. 1) 。 

43.1 调查 研究 的 三 个 时 代 


抽样 访谈 数据 环境 
区 域 概率 抽样 面对面 调查 | 单独 调查 


随机 拨号 概率 抽样 电话 调查 单独 调查 


使 用 大 数据 资源 
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非 概率 抽样 计算 机 管理 的 调查 进行 调查 


调查 研究 第 二 个 时 代 和 第 三 个 时 代 之 间 的 过 渡 并 不 是 一 帆 风 顺 
的 ， 关 于 研究 人 员 应 如 何 继续 开展 调查 研究 ， 一 直 存 在 激烈 的 争论 。 
回顾 第 一 个 时 代 和 第 二 个 时 代 之 间 的 过 渡 ， 我 认为 对 今天 的 我 们 来 
说 ， 很 关键 的 一 个 经 验 是 : 开始 并 不 是 结束 。 也 就 是 说 ， 在 第 二 个 时 
代 ， 许 多 基于 电话 的 方法 起 初 都 是 临时 决定 的 ， 而 且 也 不 太 有 效 。 但 
经 过 努力 ， 研 究 人 员 解 决 了 这 些 问题 。 例 如 ， 在 起 初 的 许多 年 里 ， 研 
究 人 员 一 直 在 摸索 随机 拨号 ， 然 后 才 产 生 了 生化 。 米 托 夫 斯 基 
(Warren Mitofsky) MAIER + BCMA (Joseph Waksberg) A 
有 民 好 实用 性 和 理论 基础 的 随机 拨号 抽样 法 〈Waksberg 1978; Brick 
and Tucker 2007) 。 因 此 ， 我 们 不 应 该 认为 第 三 个 时 代 的 方法 在 当前 
的 状态 就 是 其 最 终 状 态 。 


调查 研究 的 发 展 历程 表明 ， 这 一 领域 的 发 展 是 由 技术 和 社会 的 变 
化 所 驱动 的 ， 我 们 无 法 阻止 这 一 发 展 。 我 们 应 该 欣然 接受 这 一 发 展 ， 
并 继续 从 之 前 的 时 代 汲 取 智 慧 ， 这 也 是 我 在 本 章 将 遵循 的 理念 。 首 
先 ， 我 认为 大 数据 资源 不 会 取代 调查 ， 而 且 其 丰富 性 还 会 提升 而 不 是 
降低 调查 的 价值 (3.2 节 ) 。 鉴 于 这 一 点 ， 我 将 总 结 在 调查 研究 的 前 两 
个 时 代 发 展 起 来 的 调查 误差 总 框架 〈3. 3 节 ) 。 该 框架 能 让 我 们 了 解 有 
天 代表 性 的 新 方法 ， 尤 其 是 非 概率 样本 〈3. 455) 以 及 训 量 的 新 方法 ， 
特别 是 向 受 访 者 提问 的 新 方法 (3.597) 。 最 后 ， 我 将 描述 两 个 将 调查 
数据 和 大 数据 资源 结合 起 来 的 研究 模板 〈3. 6 节 ) 。 


3.5 提问 的 新 方法 


传统 的 调查 是 不 公开 的 、 无 聊 的 ， 并 且 远 离 生活 。 而 如 今 ， 我 们 
可 以 问 一 些 更 开放 、 更 有 趣 、 更 贴近 生活 的 问题 。 


调查 误差 总 框架 促使 研究 人 员 将 调查 研究 作为 一 个 由 两 部 分 组 成 
的 过 程 来 思考 ， 这 两 个 部 分 分 别 是 招募 受 访 者 和 同 他 们 提问 。 在 3. 4 市 
中 ， 我 介绍 了 数字 时 代 是 如 何 改变 我 们 招 葵 受 访 者 的 方式 的 ， 而 现在 
我 将 介绍 数字 时 代 如 何 让 研究 人 员 能 以 新 的 方法 来 提问 。 这 些 新 方法 
可 以 被 用 于 概率 样本 或 非 概率 样本 。 


调查 方式 是 关于 问题 传递 的 方式 或 渠道 的 ， 它 对 测量 有 重要 的 影 
啊 (Couper 2011) 。 在 调查 研究 的 第 一 个 时 代 ， 最 常见 的 方式 是 面 对 
面 ， 而 在 第 二 个 时 代 ， 则 是 电话 。 有 些 研究 人 员 将 调查 研究 的 第 三 个 
时 代 看 作 仅仅 是 调查 方式 的 增加 ， 新 增 了 计算 机 和 手机 。 然 而 数字 时 
代 不 仅仅 意味 着 问题 和 答案 传递 渠道 的 改变 ， 从 模拟 到 数字 的 转变 使 
研究 人 员 能 够 改变 其 提问 的 方式 。 


迈克 尔 。 肖 人 Michael Schober) 和 同事 的 一 项 研究 可 以 说 明 调 
整 传统 方法 以 使 其 更 好 地 匹配 数字 时 代 通 信和 系统 的 好 处 。 在 这 项 研究 
中 ， 肖 伯 和 同事 比较 了 几 种 不 同 的 利用 手机 同 受 访 者 提问 的 方法 。 其 
中 一 种 是 语 首 会 话 ， 该 方法 可 以 说 是 调查 研究 第 二 个 时 代 方 法 的 延 
伸 ， 男 一 种 是 通过 短信 发 送 的 微观 调查 ， 该 方法 没有 什么 广为人知 的 
先例 。 然 后 他 们 发 现 ， 相 比 于 语 首 会 话 ， 通 过 短信 发 送 的 微观 调查 能 
搜集 到 质量 更 高 的 数据 。 换 句 话 说， 只 是 简单 地 用 新 媒介 来 实施 旧 方 
法 ， 是 无 法 搜集 到 最 高 质量 的 数据 的 。 相 反 ， 通 过 清楚 地 思考 手机 相 


天 的 功能 和 社会 规范 ， 首 伯 和 同事 找到 了 一 种 更 好 的 提问 方式 ， 进 而 
搜集 到 了 更 高 质量 的 答案 。 


研究 人 员 可 以 从 多 个 维度 对 调查 方式 进行 分 类 ， 但 我 认为 数字 时 
代 调 查 方式 最 主要 的 特征 是 通过 计算 机 管理 ， 而 不 是 由 采访 者 管理 
(例如 电话 和 面对面 访谈 调查 ) 。 采 访 者 不 参与 数据 采集 过 程 有 诸多 
好 处 ， 这 同时 市 来 了 一 些 挑战 。 就 好 处 而 言 ， 采 访 者 不 参与 数据 采集 
可 以 减少 社会 期 望 偏 莽 ， 而 社会 期 望 偏差 会 使 受 访 者 倾 铝 于 以 最 好 的 
方式 来 呈现 自己 ， 例 如 谎 称 自己 没有 做 过 滥用 药物 等 被 社会 污 名 化 的 
行为 ， 或 谋 称 自己 做 过 投票 等 被 提倡 的 行为 〈Kreuter，Presser，and 
Tourangeau 2008) 。 采 访 者 不 参与 数据 采集 还 能 消除 采访 者 的 影响 ， 
即 采 访 者 的 某 些 特点 倾 癌 于 以 微妙 的 方式 影响 受 访 者 的 答案 〈West 
and Blom 2016) 。 除 了 可 能 提高 某 类 问题 答案 的 准确 度 以 外 ， 采 访 者 
不 参与 数据 采集 还 能 大 大 降低 成 本 《访谈 时 间 是 调查 研究 中 最 大 的 成 
本 之 一 ) ， 并 且 增 加 了 灵活 性 〈 受 访 者 可 以 按 自 己 的 意愿 随时 参与 调 
查 ， 而 不 是 受制 于 采访 者 的 时 间 ) 。 就 挑战 而 言 ， 如 果 调 查 是 采访 者 
管理 的 ， 那 么 采访 者 可 以 与 受 访 者 建立 良好 的 关系 ， 进 而 提高 参与 
率 ， 同 时 对 受 访 者 不 理解 的 问题 还 能 给 予 解 释 。 对 于 问题 特别 多 的 调 
得 问卷 〈 可 能 会 很 乏味 ) ， 采 访 者 还 可 以 保证 受 访 者 的 完成 度 
(Garbarski, Schaeffer, and Dykema 2016) 。 因 此 ， 从 采访 者 管理 
的 调查 方式 到 计算 机 管理 的 调查 方式 ， 这 种 转变 既 市 来 了 机 过 也 禹 来 
了 挑战 。 


接 下 来 ， 我 将 介绍 两 种 提问 的 方法 ， 表 明 研 究 人 员 如 何 借助 数字 
时 代 的 工具 以 不 同 的 方式 发 问 : 用 来 在 更 合适 的 时 间 和 地 点 测量 内 部 
状态 的 生态 瞬时 评 佑 法 〈3. 5. 1 小 节 ) 以 及 络 合 了 开放 式 问 题 和 封闭 式 
问题 优点 的 维基 调查 (3. 5. 2 小 节 ) 。 然 而 ， 由 计算 机 管理 的 、 不 受 地 
点 限制 的 提问 方式 的 出 现 ， 也 意味 着 我 们 需要 设计 出 受 访 者 更 喜欢 的 
提问 方式 ， 这 一 过 程 有 时 被 称 为 游戏 化 〈3. 5. 3 小 节 ) 。 


3.5.1 生态 瞬时 评估 法 


研究 人 员 可 以 分 解 大 型 的 调查 ， 然 后 将 其 融入 人 们 的 生活 。 


生态 瞬时 评估 法 将 传统 的 调查 分 解 ， 然 后 将 其 融入 参与 者 的 生 
活 。 因 此 ， 研 究 人 员 可 以 在 合适 的 时 间 和 地 点 进行 提问 ， 而 不 是 在 事 
情 发 生 数 周 后 才 通过 一 个 长 时 间 的 访谈 来 了 解 。 


生态 瞬时 评估 法 主要 有 4 个 特征 : (1) 在 现实 环境 中 搜集 数据 ; 
(2) 评估 的 是 个 体 当 前 或 最 近 的 状态 或 行为 ，〈(3) 评估 可 能 是 基于 
事件 的 、 基 于 时 间 的 或 随机 引发 的 (取决 于 研究 问题 ; (4) 随 着 时 
间 的 推移 需 进行 多 次 评估 (Stone and Shiffman 1994) 。 一 天 中 人 们 
可 以 不 断 通过 智能 手机 进行 交流 ， 这 大 大 提高 了 生态 瞬时 评估 法 的 便 
利 性 。 此 外 ， 智 能 手机 上 钱 有 各 种 传感器 ， 例 如 GPS (全球 定 位 系统 ) 
和 加 速 计 ， 因 此 研究 人 员 可 以 通过 用 户 的 活动 情况 启动 相应 的 测量 。 
例如 ， 可 将 以 智能 手机 设置 为 当 受 访 者 进入 某 特定 街区 时 便 疝 其 提 一 


个 调查 问题 。 


A BOK + AL (Naomi Sugie) 的 研究 可 以 很 好 地 说 明生 态 瞬 时 评 
估 法 的 前 景 。 自 20 世 纪 70 年 代 以 来 ， 美国 的 监禁 人 数 开 始 急剧 上 升 。 
截至 2005 年 ， 每 10 万 美国 人 中 就 有 约 500 人 在 狱 中 ， 这 一 比例 要 高 于 世 
界 上 其 他 任何 地 方 (Wakefield and Uggen 2010) 。 入 狼人 数 的 激增 
也 导致 了 出 狱 人 数 的 激增 ， 每 年 约 有 70 万 人 出 狱 (Wakefield and 
Uggen 2010) 。 这 些 人 出 狱 后 面临 着 严峻 的 挑战 ， 不 笠 的 是 ， 许 多 人 
最 后 义 回 到 了 监狱 。 为 了 了 解 和 减少 票 犯 , 社会 科学 家 和 决策 者 需要 
了 解 这 些 人 重新 进入 社会 后 的 经 历 。 然 而 ， 这 些 数 据 很 难 用 标准 的 调 
但 方 法 来 搜集 ， 因 为 这 些 曾 经 是 罪犯 的 人 往往 是 很 难 了 解 的 ， 而 且 他 
们 的 生活 非常 不 稳定 。 每 隔 几 个 月 进行 一 次 调查 的 测量 方法 会 遗漏 挥 
他 们 生活 中 大 量 的 动态 (Sugie 2016) 。 


为 了 更 精确 地 研究 他 们 重新 进入 社会 的 过 程 ， 杉 江 从 新 泽 西 州 纽 
瓦 克 市 所 有 出 狱 的 人 中 抽取 了 一 个 131 人 的 标准 概率 样本 。 她 为 样本 中 
的 每 位 参与 者 提供 了 一 部 智能 手机 ， 进 而 创建 了 一 个 既 可 以 记录 行为 
又 可 以 提问 的 丰富 的 数据 采集 平台 。 杉 江 利 用 手机 开展 了 两 类 调 碍 。 
首先 ， 她 在 上 午 9 点 和 下 午 6 点 之 间 随 机 选 了 一 个 时 间 问 参与 者 发 送 
“体验 抽样 调查 ”， 询 问 参 与 者 当下 的 活动 和 感受 。 然 后 ， 在 晚上 7 
点 ， 她 会 问 参 与 者 及 送 一 个 “每 日 调查 ”， 询 问 他 们 当天 的 所 有 活 
动 。 除 了 这 些 调查 问题 以 外 ， 手 机 还 会 定期 记录 他 们 的 地 理 位 置 ， 并 
以 加 密 的 方式 记录 有 关 打 电话 和 发 短信 的 元 数据 。 通 过 将 提问 与 观 家 
相 结 合 ， 杉 江 获 得 了 这 些 人 重新 进入 社会 后 详细 的 、 高 频 的 测量 数 
据 。 


研究 人 员 相 信 ， 找 到 稳定 的 、 高 质量 的 工作 有 助 于 人 们 成 功 地 重 
返 社 会 。 然 而 ， 杉 江 发 现 ， 平 均 来 说 ， 其 研究 参与 者 找到 的 工作 都 是 
非 正 式 的 、 临 时 的 和 零散 的 ， 但 该 平均 描述 掩盖 了 重要 的 异 质 性 。 杉 
江 在 其 样本 中 发 现 了 4 个 完全 不 同 的 群体 “早期 退出 ”最 开始 找 过 
工作 ,但 后 来 退出 了 劳动 力 市 场 ) 、“ 持 续 寻 找 ”《 融 入 社会 前 的 大 
部 分 时 间 都 花 在 找 工 作 上 ) 、“ 循 环 工作 ”《 融 入 社会 前 的 大 部 分 时 
间 都 花 在 工作 上 ) 以 及 “ 低 啊 应 ”《〈 不 会 定期 回答 调查 问题 ) 。 其 中 
“早期 退出 ”这 一 群体 最 开始 找 过 工作 ， 但 后 来 没 找到 就 放弃 了 ， 该 
群体 尤其 重要 ， 因 为 他 们 可 能 是 成 功 融 入 社会 概率 最 低 的 群体 。 


人 们 可 能 会 认为 ， 出 狱 后 找 工作 是 一 个 很 艰难 的 过 程 ， 这 些 人 可 
能 会 因为 沁 形 而 退出 劳动 力 市 场 。 因 此 ， 杉 江 通 过 她 的 调查 还 搜集 了 
有 关 参 与 者 情绪 状态 (一 种 通过 行为 数据 难以 评估 出 来 的 内 部 状态 ) 
的 数据 。 令 人 惊讶 的 是 ，“ 早 期 退出 ”这 一 群体 并 没有 称 自 己 压 力 过 
大 或 过 于 翡 伤 ， 反 倒是 那些 失败 后 继续 找 工作 的 人 称 自己 过 于 忧虑 慕 
伤 。 所 有 这 些 有 关 出 狱 人 员 行 为 和 情绪 状态 的 细微 的 、 纵 向 的 详细 数 
据 ， 对 于 理解 他 们 所 面临 的 阻碍 以 及 降低 他 们 重 返 社会 的 难度 有 痢 重 
要 意义 。 但 如 果 使 用 标准 的 调查 ， 这 些 细微 的 数据 就 会 被 遗漏 。 


杉 江 的 数据 采集 针对 的 是 一 个 弱势 群体 ， 其 数据 采集 方式 可 能 会 
引发 一 些 道德 伦理 方面 的 担忧 。 但 杉 江 预先 就 考虑 到 了 这 些 担忧 ， 并 
在 设计 过 程 中 采取 了 应 对 措施 (Sugie 2014, 2016) 。 她 所 在 大 学 的 
机 构 审 查 委 员 会 作为 第 三 方 审查 了 她 的 数据 采集 程序 ， 认 为 该 程序 符 
合 所 有 现存 规则 。 此 外 ， 杉 江 的 方法 与 我 在 第 6 章 所 提倡 的 基于 原则 的 
方法 相 一 致 ， 在 符合 现 有 法 规 方面 远 远 超出 了 要 求 的 范围 。 例 如 ， 她 
获得 了 所 有 参与 者 的 知情 同意 ， 这 是 很 有 意义 的 ， 她 还 同意 参与 者 暂 
时 关闭 位 置 妃 踪 ， 并 且 竭 尽 全 力 去 保护 她 所 搜集 的 数据 。 除 了 采用 适 
当 的 加 密 技 术 和 数据 存储 外 ， 她 还 申请 并 获得 了 联邦 政府 的 保密 证 
书 ， 这 意味 着 她 不 会 被 迫 将 数据 交 给 警察 〈Beskow，Dame，and 
Costello 2008) 。 因 为 考虑 周全 ， 所 以 我 认为 杉 江 的 项 目 给 其 他 研究 
人 员 提 供 了 一 个 有 价值 的 参考 。 尤 其 是 她 没有 不 加 思考 就 行动 而 让 自 
己 陷入 道德 伦理 的 泥潭 ， 也 没有 因为 道德 伦理 上 的 复杂 性 而 回避 重要 
的 研究 。 相 反 ， 她 仔细 思考 ， 寻 求 合 理 建 议 ， 尊 重 她 的 参与 者 ， 并 采 
取 措 施 降 低 其 研究 的 风险 、 增 加 研究 的 益处 。 


我 认为 从 杉 江 的 研究 中 可 以 学 到 以 下 三 点 : Be, fell er Ie 
与 传统 的 抽样 法 是 完全 相 容 的 ， 杉 江 就 是 从 定义 明确 的 抽样 框 总 体 中 
抽取 了 一 个 标准 的 概率 样本 。 其 次 ， 高 频 、 纵 同 的 测量 数据 对 于 研 冤 
不 规则 的 、 动 态 的 社会 经 历 是 很 有 价值 的 。 最 后 ， 当 调查 数据 采集 与 
大 数据 资源 相 结合 时 《我 认为 这 会 越 来 越 币 见 ， 我 将 在 本 章 后 面部 分 
进行 论述 ) ， 就 可 能 引发 额外 的 道德 伦理 问题 。 我 将 在 第 6 章 更 详细 地 
探讨 研究 中 的 伦理 问题 ,但 杉 江 的 事例 表明 ， 细 心 负 贡 、 考 虑 周密 的 
研究 人 员 是 可 以 解决 这 些 问 题 的 。 


3.5.2 维基 调查 


维基 调查 为 封闭 式 问题 和 开放 式 问题 的 结合 提供 了 新 的 可 能 。 


除了 能 让 我 们 在 更 合适 的 时 间 和 更 自然 的 环境 中 进行 提问 ， 新 技 
术 还 让 我 们 能 够 改变 问题 的 形式 。 大 多 数 调查 问题 都 是 封 财 的 ， 受 访 
者 只 能 从 研究 人 员 给 定 的 几 个 选项 中 进行 选择 。 一 位 赣 名 的 调查 研 冤 
人 员 称 该 过 程 为 “将 单词 放 入 人 们 的 口中 ”。 例 如 ， 以 下 就 是 一 个 封 
闭 的 调查 问题 : 


下 面 一 道 题 是 有 关 工 作 的 。 请 看 这 些 条 目 ， 你 能 告诉 我 以 下 哪 一 
项 是 你 在 一 份 工作 中 最 看 重 的 吗 ? 


at 


1. 高 薪酬 ; 

2. 没有 被 解雇 的 危险 ; 

3. 工作 时 间 短 ， 有 很 多 空闲 时 间 ; 

4. 晋升 机 会 ; 

5. 这 份 工 作 是 很 重要 的 ， 给 人 一 种 成 就 感 。 


但 这 些 是 全 部 可 能 的 答案 吗 ? 研究 人 员 将 答案 限制 在 这 5 个 选项 中 
会 不 会 遗漏 了 一 些 重要 的 东西 呢 ? 与 封闭 式 问题 相对 应 的 是 开放 陈 问 
题 ， 以 下 古 以 开放 的 形式 对 同一 个 问题 进行 提问 : 


下 面 一 道 题 是 有 关 工 作 的 。 对 于 工作 ， 人 们 追寻 的 是 不 同 的 东 
西 。 那 你 在 一 份 工 作 中 最 看 重 的 是 什么 呢 ? 


尽管 这 两 个 问题 看 起 来 很 相似 ， 但 霍华德 。 舒 受 (Howard 
Schuman) 和 斯 坦 利 。 普 雷 瑟 (Stanley Presser) 的 一 项 调查 实验 表 
明 ， 它 们 可 以 产生 非常 不 同 的 结果 : 近 60% 的 以 开放 方式 提问 而 搜集 到 
的 答案 ， 都 不 在 研究 人 员 给 定 的 选项 中 (图 3.9) 。 


你 在 一 份 工作 中 最 看 重 的 是 什么 呢 ? 
封闭 式 问 题 开放 式 问 题 


成 就 感 
晋升 
薪酬 
安全 

C/E lal Fe - 

未 做 回答 

不 知道 
满足 感 
令 人 开心 的 工作 
[ 作 环 境 

[ 作 明 确 具 体 
其 他 
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0 20 40 60 0 20 40 60 (%) 
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图 3.9 一 项 调查 实验 的 结果 表明 ， 采 用 封闭 的 方式 提问 与 采用 开放 的 方式 提问 所 搜 
集 到 的 答案 不 一 样 。 改 编 自 Schuman and Presser (1979) , #1. 


尽管 开放 式 问 题 和 封闭 式 问 题 可 以 产生 完全 不 同 的 信息 ， 而 且 两 
种 形式 的 问题 在 调查 研究 的 早期 都 很 受 欢 迎 ， 现 在 处 于 主导 地 位 的 却 
古 封闭 式 问题 。 这 并 不 是 因为 封闭 式 问题 被 证 明 能 产生 更 好 的 测量 数 
据 ， 而 是 因为 封闭 式 问题 使 用 起 来 要 简 蛙 很 多 ， 因 为 分 析 开 放 式 问题 
的 过 程 易于 出 错 且 成 本 高 郧 。 研 究 人 员 逐 渐 不 再 采用 开放 式 问 题 ， 这 
真是 令 人 遗憾 ， 因 为 正 是 那些 研究 人 员 事 先 不 知道 的 信息 才 古 最 有 价 
值 的 信息 。 


然而 ， 从 人 类 管理 的 调查 到 计算 机 管理 的 调 碍 ， 这 一 转变 为 这 个 
老 问题 找到 了 一 个 新 的 解决 办 法 。 如 果 我 们 现在 能 设计 出 融合 了 开放 
式 问题 和 封闭 式 问 题 各 上 自 优 点 的 调查 问题 ， 会 怎么 样 呢 ?” 也 就 是 说 ， 


如 果 我 们 的 调查 既 能 搜集 到 新 的 信息 又 能 保证 答案 易于 分 析 ， 会 怎么 
FEWE? 这 正 是 卡 伦 。 利 维 〈Karen Levy) 和 我 已 着 手 想 要 实现 的 。 


具体 而 言 ， 卡 伦 和 我 认为 ， 搜 集 和 管理 用 户 生成 内 容 的 网 站 可 能 
会 影响 新 型 调查 的 设计 。 尤 其 是 维基 百科 (内 容 主要 由 用 户 生 成 的 动 
态 开放 系统 的 绝 佳 案例 ) ， 它 让 我 们 很 受 局 发 ， 因 此 我 们 称 这 个 新 型 
调查 为 维基 调查 。 正 如 维基 百科 会 基于 参与 者 的 想法 逐步 发 展 ， 我 们 
也 设想 了 一 个 会 基于 参与 者 想法 而 逐步 发 展 的 调查 。 卡 伦 和 我 认为 ， 
维基 调查 应 满足 三 个 特性 : REE. POE MEAG IVE. AI, FRAT A 
一 组 网 站 开发 人 员 一 起 创建 了 一 个 可 以 开展 维基 调查 的 网 站 : 
http://www. allourideas. org. 


我 们 可 以 通过 与 纽约 市 长 办 公 室 共同 开展 的 一 个 项 目 来 了 解 维 基 
调查 的 数据 采集 过 程 。 该 项 目 则 在 将 居民 的 想法 整合 到 纽约 市 可 持续 
发 展 规 划 中 去 。 首 先 ， 市 长 办 公 室 根据 他 们 之 前 的 外 展 服务 (例如 
“要 求 所 有 大 型 建筑 都 要 进行 一 定 的 能 效 升 级 ”以 及 “把 教 孩子 环保 
知识 作为 学 校 谋 程 的 一 部 分 ”) 列 出 了 25 个 想法 ， 以 此 作为 这 样 一 个 
问题 的 备 选 答案 : 你 认为 哪 一 项 更 有 利于 创建 一 个 更 环保 的 、 更 好 的 
纽约 市 ? 然后 ， 计 算 机 会 随机 从 备 选 答案 中 抽取 2 个 (例如 “开放 纽约 
市 所 有 学 校 的 操场 作为 公共 体育 场 ” 和 “增加 唆 虹 发 病 京 高 的 社区 的 
植树 量 ”) ， 供 受 访 者 选择 (图 3. 10) 。 受 访 者 做 出 选择 后 ， 计 算 机 
会 立即 再 随机 抽取 2 个 想法 供 其 选择 。 
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图 3.10 一 个 维基 调查 的 界面 。 图 左 是 回答 界面 ， 图 右 是 结果 界面 。 经 允许 转载 自 
Salganik and Levy (2015) ， 图 2。 


只 要 受 访 者 愿意 ， 通 过 二 选 一 或 选择 “我 无 法 决定 ”， 受 访 者 可 
以 一 直 回 答 他 更 偏向 于 哪 种 方 采 。 最 重要 的 是 ， 受 访 者 可 以 在 任何 时 
候 贡 献 他 们 自己 的 想法 ， 这 些 想 法 经 过 市 长 办 公 室 的 同意 后 ， 可 以 作 
为 备 选 答案 呈现 给 其 他 受 访 者 。 因 此 ， 受 访 者 回答 的 问题 既是 开放 的 
又 是 封闭 的 。 


为 了 搜集 居民 的 反馈 信息 ， 市 长 办 公 室 于 2010 年 10 月 启动 了 该 维 
基调 查 ， 同 时 还 开展 了 一 系列 的 社区 会 谈 。 在 大 约 4 个 月 的 时 间 里 ， 
1436 名 受 访 者 贡献 了 31893 个 答案 以 及 464 个 新 想法 。 至 关 重 要 的 是 ， 
前 10 个 最 受 欢迎 的 想法 中 有 8 个 是 受 访 者 提出 来 的 ， 而 不 是 源 于 市 长 办 
公 室 起 初 列 出 的 25 个 想法 。 并 且 ， 正 如 我 们 在 论文 中 所 描述 的 那样 ， 
受 访 者 贡献 的 想法 比 研究 人 员 给 定 的 想法 更 受 欢 迎 的 现象 在 许多 维基 
调查 中 都 出 现 过 。 换 句 话 说， 通过 允许 受 访 者 贡献 自己 的 想法 ， 研 究 
人 员 能 够 了 解 到 更 多 的 信息 ， 而 这 些 信息 在 使 用 更 封闭 的 方法 进行 调 
但 时 可 能 会 被 遗漏 掉 。 


除了 这 些 具体 调查 的 结果 以 外 ， 我 们 的 维基 调查 项 目 还 展示 了 数 
字 研 究 的 成 本 结构 是 如 何 让 研究 人 员 能 以 不 同 的 方式 接触 世界 的 。 现 
在 ， 学 术 研 究 人 员 能 够 创建 可 供 许 多 人 使 用 的 真实 系统 : 我 们 已 经 主 
办 了 超过 10000 项 维基 调查 ， 搜 集 了 1500 多 万 份 答 案 。 这 种 创造 可 以 大 
规模 使 用 的 东西 的 能 力 源 于 这 样 一 个 事实 : 一 旦 一 个 网 站 建立 起 来 
了 ， 那 么 让 世界 上 的 每 个 人 都 免费 使 用 它 基 本 上 不 会 再 产生 成 本 〈( 当 
然 ， 如 果 我 们 采取 由 人 类 管理 的 访谈 ， 就 无 法 实现 这 一 点 ) 。 此 外 ， 
这 样 的 规模 可 以 使 研究 人 员 开 展 不 同类 型 的 研究 。 例 如 ， 这 1500 多 万 
份 答案 以 及 大 量 的 参与 者 为 未 来 的 方法 研究 提供 了 一 个 宝贵 的 测试 
场 。 在 第 4 章 介绍 实验 时 我 将 进一步 描述 数字 时 代 成 本 结构 〈 尤 其 是 成 
本 不 会 随 着 所 搜集 数据 量 的 增加 而 增加 〉 所 创造 的 其 他 研究 机 会 。 


3.5.3 游戏 化 


标准 调查 对 参与 者 来 说 是 很 无 聊 的 。 这 种 情况 可 以 改变 ， 而 且 必 
须 改 变 。 


到 目前 为 止 ， 我 已 经 向 大 家 介绍 了 一 些 新 的 提问 方法 ， 而 计算 机 
管理 的 调查 则 对 这 些 方法 的 出 现 起 到 了 促进 作用 。 但 计算 机 管理 的 调 
碍 也 有 一 个 缺点 ， 那 就 是 没有 一 个 采访 者 来 帮助 谤 导 和 保持 受 访 者 的 
参与 度 。 这 之 所 以 成 为 一 个 问题 ， 是 因为 许多 调查 既 费 时 又 枯燥 。 因 
此 ， 在 未 来 ， 调 但 设 计 者 在 设计 过 程 中 将 不 得 不 考虑 参与 者 的 想法 ， 
以 便 使 回答 问题 的 过 程 更 恰 快 、 更 像 游戏 。 这 一 过 程 有 时 被 称 为 游戏 
Mo 


我 将 通过 “朋友 感觉 ” (Friend Sense) 这 项 调查 来 说 明 怎 样 才 
可 能 做 出 一 项 有 趣 的 调查 。 该 调查 是 在 脸谱 网 上 进行 的 ， 看 起 来 像 是 
AMEX o VO FIA + LR nr + MEAR (Winter Mason) 和 邓肯 。 
ER AAA ARMA AMA AA GARA DRAM, WR 
际 上 与 朋友 有 多 相似 。 这 个 有 关 真 实 的 态度 相似 度 和 感知 的 态度 相似 
上 度 的 问题 ， 可 以 直接 反映 人 们 精确 感知 目 己 社交 环境 的 能 力 ， 并 对 政 
治 极 化 和 社会 变化 的 动态 产生 影响 。 从 概念 上 讲 ， 真 实 的 态度 相似 度 
和 感知 的 态度 相似 度 是 很 容易 测量 的 。 研 究 人 员 可 以 束 某 方面 的 观点 
同人 们 提问 ， 然 后 再 问 他 们 的 朋友 (这样 可 以 测 得 真实 的 态度 相似 
度 ) ， 也 可 以 让 人 们 猜 其 朋友 的 态度 (这 样 可 以 测 得 感知 的 态度 相似 
RE) 。 但 可 惜 的 是 ， 既 采访 受 访 者 又 采访 其 朋友 ， 实 施 起 来 特别 困 
难 。 因 此 ， 戈 埃 尔 和 同事 把 他 们 的 调查 变 成 了 一 个 好 玩 的 脸谱 网 应 用 
程序 。 


在 一 位 参与 者 同意 参加 一 项 研究 后 ， 该 应 用 程序 会 从 该 参与 者 的 
脸谱 网 中 选择 一 位 好 友 ， 然 后 就 该 好 友 的 态度 向 参与 者 提问 〈 图 
3.11) 。 在 回答 有 关 随 机 选择 的 朋友 的 问题 时 ， 该 参与 者 也 要 回答 有 


天 目 己 的 问题 。 在 答 完 有 关 一 个 朋友 的 问题 时 ， 系 统 会 告诉 该 参与 者 
其 答案 是 人 否 正 确 ， 如 宁 该 参与 者 的 朋友 没有 作答 ， 该 参与 者 还 可 以 或 
励 他 作答 。 因 此 ， 这 项 调查 在 一 定 程度 上 是 通过 病毒 式 招租 来 传播 
的 。 


Would Sharad Goel go see the Spice Girls 
reunion tourif given free tickets? 


图 3.11 “朋友 感觉 ”的 界面 (Goel, Mason, and Watts 2010) 。 研 究 人 员 把 标准 
的 态度 调查 变 成 了 一 项 有 趣 的 、 类 似 游戏 的 体验 。 应 用 程序 向 参与 者 提 的 问题 有 严 
肃 的 也 有 轻松 的 。 好 友基 像 经 过 了 模糊 处 理 。 经 沙拉 德 。 芒 埃 尔 允许 转载 。 


这 些 有 关 态 度 的 问题 改编 自 美国 综合 社会 调查 。 例 如 : “在 中 东 
局 势 中 ， 相 比 于 巴勒斯坦 人 ，“【〔 你 的 朋友 〉 更 同情 以 色 列 人 是 吗 ? ” 
以 及 “你 的 朋友 ) 会 为 了 让 政府 能 够 提供 全 民 医 保 而 缴 更 多 的 税 
吗 ? ”除了 这 些 严肃 的 问题 以 外 ， 研 究 人 员 还 会 设置 更 轻松 的 问题 : 
“ 相 比 于 啤酒 ，《〈 你 的 朋友 ) 更 喜欢 葡 荀 酒 是 吗 ? ”以 及 “【〔 你 的 朋 
友 ) 更 希望 拥有 读 心术 而 不 是 会 飞 是 吗 ? ”这 些 更 轻松 的 问题 会 让 参 
与 者 觉得 这 个 过 程 很 有 趣 ， 同 时 也 让 我 们 能 够 进行 一 项 有 趣 的 比较 : 
参与 者 和 朋友 在 严肃 的 政治 问题 上 以 及 有 关 喝 酒 和 超 能 力 的 轻松 问题 
上 的 态度 相似 度 会 基本 一 样 吗 ? 


这 项 研究 主要 得 出 了 三 个 结论 。 首 先 ， 相 比 于 卫生 人 ， 朋 友 更 可 
能 给 出 相同 的 答案 ， 但 即使 是 很 杀 密 的 朋友 ， 也 在 约 30% 的 问题 上 持 不 
同 的 观点 ;， 其次， 参与 者 往往 高 估 上 自己 与 朋友 的 相似 度 ， 换 句 话说 ， 


朋友 之 间 在 看 法 上 的 大 多 数 差 异 都 没有 被 注意 到 ， 最后， 在 有 关 政 治 
的 严肃 问题 上 以 及 有 关 喝 酒 和 超 能 力 的 轻松 问题 上 ， 参 与 者 对 目 己 与 
朋友 在 看 法 上 的 差异 的 感知 基本 是 一 样 的 。 


尽管 这 款 应 用 程序 现在 已 经 不 能 再 玩 了 ， 但 它 很 好 地 说 明了 研究 
人 员 如 何 能 让 一 个 标准 的 态度 调查 变 得 有 趣 。 更 广泛 地 说 ， 通 过 一 些 
创造 性 的 想法 和 设计 工作 ， 研 究 人 员 就 有 可 能 改善 调查 参与 者 的 用 户 
体验 。 因 此 ， 下 次 你 设计 一 项 调查 时 ， 要 花 点 时 间 思 考 一 下 你 能 做 些 
什么 来 让 你 的 参与 者 感觉 更 好 。 有 些 人 可 能 会 担心 这 些 追求 游戏 化 的 
举措 会 影响 数据 质量 ， 但 我 认为 ， 觉 得 调查 无 聊 的 参与 者 对 数据 质量 
的 影响 要 大 得 多 。 


戈 埃 尔 和 同事 的 调查 研究 也 体现 了 下 一 节 的 主题 : 将 调查 与 大 数 
据 资源 结合 起 来 。 在 戈 埃 尔 和 同事 的 事例 中 ， 他 们 通过 将 调查 与 脸谱 
网 结合 起 来 ， 自 动 获得 了 参与 者 的 好 友 列 表 。 在 下 一 节 中 ， 我 们 将 更 
详细 地 探究 调查 与 大 数据 资源 之 间 的 结合 。 


3.6 与 大 数据 资源 相 结合 的 调查 


将 调查 与 大 数据 资源 结合 起 来 ， 能 让 你 得 出 单独 通过 调查 或 大 数 
据 资源 所 无 法 得 出 的 评估 结论 。 


大 多 数 调查 都 是 独立 进行 的 。 它 们 没有 以 彼此 为 基础 ， 也 没有 借 
助 世界 上 现 有 的 其 他 数据 。 这 种 现象 将 会 改变 。 将 调查 数据 与 第 2 章 介 
绍 的 大 数据 资源 结合 起 来 ， 我 们 将 得 到 更 多 荔 处 。 通 过 这 两 种 类 型 数 
据 的 结合 ， 我 们 就 能 做 那些 只 通过 调查 数据 或 只 通过 大 数据 资源 不 可 
能 做 到 的 事情 。 


将 调查 数据 与 大 数据 资源 结合 起 来 有 几 种 不 同 的 方法 。 在 本 
中 ， 我 将 介绍 两 种 有 用 而 截然 不 同 的 方法 ， 我 称 它们 为 丰富 型 提问 和 
扩充 型 提问 (图 3. 12) 。 虽 然 对 每 种 方法 我 都 将 通过 一 个 详细 的 事例 
来 说 明 ， 但 大 家 应 该 可 以 看 出 ， 这 两 种 方法 其 实 可 以 被 用 于 不 同类 型 
的 调查 数据 和 不 同类 型 的 大 数据 。 此 外 ， 大 家 还 应 注意 ， 这 两 个 事例 
中 的 每 一 个 都 可 以 用 两 种 不 同 的 视角 看 符 。 回 想 一 下 第 1 章 的 内 容 ， 有 
些 人 会 把 这 些 研究 看 作 “ 非 现成 ”调查 数据 增强 “现成 ”大 数据 的 事 
例 ， 而 其 他 人 则 会 把 它们 看 作 “ 现 成 ”大 数据 增强 “ 非 现成 ”调查 数 
据 的 事例 。 大 家 应 该 兼备 这 两 种 视角 。 最 后 ， 大 家 要 注意 这 两 个 事例 
如 何 说 明了 调查 数据 和 大 数据 资源 应 该 彼此 互补 而 不 是 符 代 。 
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图 3.12 两 种 将 大 数据 资源 和 调查 数据 结合 起 来 的 主要 方法 。 在 丰富 型 提问 (3.6.1 
小 节 ) 中 ， 大 数据 资源 中 含有 研究 人 员 感 兴趣 的 核心 数据 ， 而 调查 数据 国 绕 该 大 数 
据 资源 构建 起 了 必要 的 背景 。 在 扩充 型 提问 (3. 6. 2 小 节 ) 中 ， 大 数据 资源 中 没有 研 
完 人 员 感 兴趣 的 核心 数据 ， 但 研究 人 员 可 以 用 它 来 扩充 调查 数据 。 


3.6.1 丰 宣 型 提问 


在 丰富 型 提问 中 ， 大 数据 资源 含有 一 些 重要 的 测量 数据 ， 但 缺失 
其 他 一 些 测量 数据 ， 而 调查 数据 围绕 该 大 数据 资源 构建 起 了 必要 的 背 


Ro 


VE BERE UA EA HT, RAE 
提问 。 在 丰富 型 提问 中 ， 大 数据 资源 中 含有 一 些 重要 的 测量 数据 ， 但 
缺失 其 他 一 些 测量 数据 ， 因 此 研究 人 员 需 要 通过 一 项 调查 来 搜集 这 些 
缺失 的 数据 ， 然 后 将 两 部 分 数据 资源 结合 起 来 。 丰 定型 所 问 的 一 个 事 


例 是 我 在 3. EEE AA oe A ARAS EN A sh) ee a AE 
BRIEFEN TE. ER, TA EA ee ESE A Sy fhe es 
的 日 志 数 据 进行 了 结合 。 


然而 ， 伯 元 和 元 劳 特 当 时 的 工作 环境 意味 着 他 们 无 须 面 对 那 些 进 
行 丰富 型 提问 的 研究 人 员 通 常会 面临 的 两 大 难题 。 其 中 一 个 是 ， 如 果 
两 个 数据 资源 中 都 没有 可 用 来 确保 一 个 数据 集中 的 正确 记录 与 男 一 个 
数据 集中 的 正确 记录 相 匹 配 的 唯一 标识 符 ， 那 么 就 很 难 将 个 体 层 面 的 
数据 集 链接 起 来 〈 这 是 一 个 被 称 为 记录 链接 的 过 程 ) 。 第 二 个 难题 
是 ， 大 数据 资源 的 质量 通常 很 难 评估 ， 因 为 数据 创建 的 过 程 可 能 是 不 
对 外 公开 的 ， 并 且 大 数据 资源 容易 受到 第 2 章 所 描述 的 问题 的 影响 。 换 
句 话 说 ， 丰 富 型 提问 经 常 需要 将 调查 与 质量 未 知 的 黑匣子 似 的 数据 资 
源 链接 起 来 ， 而 这 一 过 程 很 容易 出 错 。 尽 管 存 在 这 些 问题 ， 但 我 们 还 
是 可 以 利用 丰富 型 提问 开展 重要 的 研究 ， 正 如 斯 蒂 分 。 安 索 拉 比 区 
(Stephen Ansolabehere) 和 埃 坦 。 赫 什 (Eitan Hersh) 针对 美国 的 
投票 模式 所 进行 的 研究 那样 。 


投票 率 一 直 是 大 量 政治 科学 研究 的 主题 ， 而 且 在 过 去 ， 研 究 人 员 
对 于 谁 投票 以 及 为 什么 投票 的 理解 基本 上 都 基于 对 调查 数据 的 分 析 。 
但 在 美国 ， 投 票 是 一 种 非 比 寻常 的 行为 ， 因 为 政府 会 记录 每 个 公民 是 
AER. (当然 ， 政 府 没 有 记录 每 个 公民 把 票 投 给 了 谁 。) 多 年 来 ， 
政府 的 这 些 投票 记录 都 是 纸 质 版 的 ， 分 散在 全 国 各 地 的 地 方 政府 办 公 
室 中 。 这 使 政治 科学 家 很 难 ( 但 也 不 是 不 可 能 ) 获得 全 体 选 民 的 投票 
记录 ， 并 将 他 们 在 调查 中 关于 投票 所 说 的 内 容 和 实际 的 投票 行为 进行 
比较 CAnsolabehere and Hersh 2012) 。 


但 这 些 投票 记录 现在 已 经 被 数字 化 了 。 通 过 系统 地 搜集 和 汇总 这 
些 记录 ， 一 些 私 人 公司 已 经 创建 了 包含 所 有 美国 人 投票 行为 的 全 面 主 
投票 文件 。 安 索 拉 比 赫 和 赫 什 就 选择 了 与 其 中 一 家 公司 Catalist( 吸 
AD 合作 ， 以 利用 其 主 投票 文件 帮助 他 们 更 好 地 了 解 全 体 选 民 。 此 


外 ， 因 为 他 们 的 研究 依赖 于 上 述 这 家 公司 《该 公司 在 数据 采集 和 汇总 
方面 投入 了 大 量 的 资源 ) 所 搜集 和 管理 的 数字 记录 ， 所 以 他 们 现在 要 
比 之 前 没有 公司 帮助 且 使 用 模拟 记录 开展 研究 时 多 了 许多 优势 。 


像 第 2 章 的 许多 大 数据 资源 一 样 ， 安 索 拉 比 蔡 和 赫 什 获得 的 主 投票 
文件 中 也 没有 太 多 他 们 所 需要 的 人 口 统计 、 态 度 以 及 行为 方面 的 信 
息 。 事 实 上 ， 他 们 特别 感 兴趣 的 是 比较 调查 中 报告 的 投票 行为 和 经 过 
验证 的 投票 行为 ( 即 Catalist 数 据 库 中 的 信息 )。 因 此 ， 安 索 拉 比 赫 
和 赫 什 借助 本 章 前 面 提 到 的 大 型 社会 调查 一 一 合作 国会 选举 研究 ， 搜 
集 了 他 们 想 要 的 数据 。 然 后 ， 他 们 把 搜集 来 的 数据 交 给 了 Catalist， 
Catalist 汇 总 后 又 将 包括 经 验证 的 投票 行为 〈 源 于 Catalist) , HR 
报告 的 投票 行为 ( 源 于 合作 国会 选举 研究 ) 以 及 受 访 者 的 人 口 统计 资 
料 和 态度 在 内 的 数据 文件 返回 给 了 他 们 (图 3. 13) 。 换 名 话说 ， 安 索 
拉 比 茜 和 区 什 的 研究 只 有 将 投票 记录 与 调查 数据 结合 起 来 才能 开展 ， 
如 果 只 有 投票 记录 或 只 有 调查 数据 ， 人 研究 是 不 可 能 开展 的 。 


利用 结合 后 的 数据 文件 ， 安 索 拉 比 赫 和 赫 什 得 出 了 三 个 重要 结 
论 。 首 先 ， 过 度 报 告 投票 行为 的 现象 很 是 普遍 : 未 投票 者 中 几乎 有 一 
半 的 人 报告 称 自己 投 过 票 ， 并 且 如 果 有 人 报告 称 目 己 投 过 票 ， 实 际 上 
他 真正 投 过 票 的 概率 只 有 80%。 其 次 ， 过 度 报 告 并 不 是 随机 的 : 过 度 报 
告 在 高 收入 、 受 过 民 好 教育 、 参 与 公共 事务 的 党 派 人 士 中 更 为 常见 。 
换 句 话说 ， 最 有 可 能 投票 的 人 也 最 有 可 能 谋 报 目 己 投 过 票 。 最 后 ， 也 
是 最 重要 的 一 个 结论 是 ， 由 于 过 度 报 告 的 系统 性 ， 投 票 者 和 未 投票 者 
之 间 的 实际 差异 比 调查 所 显示 的 要 小 。 例 如 ， 拥 有 和 学士 学 位 的 人 报告 
称 目 己 投 过 标的 可 能 性 要 比 没有 的 人 高 约 22%， 而 其 实际 投票 的 可 能 性 
只 高 出 了 10%。 事 实证 明 ， 相 比 于 预测 谁 会 真正 投票 ， 现 有 的 以 数据 源 
为 基础 的 理论 在 预测 谁 会 报告 称 自己 投 过 加 (这 也 是 研究 人 员 过 去 所 
使 用 的 数据 方面 ， 准 确 度 会 更 高 。 因 此 ， 安 索 拉 比 赫 和 赫 什 的 实证 
发 现 表 明 ， 我 们 需要 新 的 理论 来 理解 和 预测 投票 。 
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图 3.13 安 索 拉 比 赫 和 赫 什 的 研究 示意 图 。 为 了 创建 主 数 据 文件 ，Catalist 需 将 多 个 
不 同 来 源 的 信息 进行 汇总 和 统一 。 这 一 过 程 ， 无 论 多 么 小 心 ， 都 会 使 原始 数据 资源 
中 的 错误 得 以 传播 ， 同 时 还 会 引发 新 的 错误 。 第 二 个 错误 的 来 源 是 调查 数据 和 主 数 
据 文件 之 间 的 记录 链接 。 如 果 每 个 人 在 上 述 两 个 数据 资源 中 都 有 一 个 稳定 的 、 唯 一 
的 标识 符 ， 那 么 链接 就 会 很 简单 。 但 Catal ist 只 能 通过 不 完美 的 标识 符 〈 在 该 事例 
中 是 指 姓 名 、 性 别 、 出 生年 份 以 及 家 庭 住址 ) 进行 链接 。 不 幸 的 是 ， 在 许多 情况 下 
会 出 现 不 完整 或 不 精确 的 信息 ， 例 如 一 位 名 叫 荷 马 。 辛 普 森 (Homer Simpson) 的 投 
时 者 可 能 会 被 登记 为 荷 马 。 杰 '。 TEA. DS FHA. AZAR, RE 
主 数据 文件 中 和 记录 链接 过 程 中 都 有 可 能 出 现 错误 ， 但 通过 几 种 不 同类 型 的 检查 ， 

安 索 拉 比 赫 和 赫 什 对 他 们 的 评估 结论 还 是 有 信心 的 。 


但 对 于 这 些 结果 我 们 又 能 信任 多 少 呢 ? 不 要 瑟 了 这 些 结果 依赖 于 
一 个 易于 出 错 的 链接 过 程 ， 而 且 这 一 过 程 需 要 链接 至 拥有 未 知 数量 错 
误 的 黑匣子 似 的 数据 中 。 更 具体 地 说 ， 这 些 结果 取决 于 两 个 关键 步 
KR: (1) Catalist 将 许多 完全 不 同 的 数据 资源 汇总 后 ， 形 成 一 个 精确 
的 主 数据 文件 ，〈2) 将 调查 数据 链接 至 上 述 主 数据 文件 。 其 中 每 个 步 


又 都 很 困难 ， 而 且 任 何 一 个 步骤 中 的 错误 都 会 导致 研究 人 员 得 出 错误 


的 结论 。 


然而 ， 作 为 一 个 公司 ， 数 据 处 理 和 链接 对 其 继续 生存 来 说 至 关 重 
要 ， 所 以 Catalist 能 以 学 术 研究 人 员 无 法 企及 的 规模 投入 资源 ， 解 决 
这 些 问 题 。 在 他 们 的 论文 中 ， 安 索 拉 比 赫 和 赫 什 通 过 一 系列 步 又 检查 
了 上 述 两 个 步 又 的 结果 (尽管 有 些 是 不 对 外 开放 的 ) ， 这 些 检查 对 其 
他 想 要 将 调查 数据 和 黑匣子 似 的 大 数据 资源 结合 起 来 的 研究 人 员 可 能 
会 有 所 帮助 。 


一 般 来 说 ， 研 究 人 员 通 过 该 研究 能 学 到 什么 经 验 呢 ? 首 先 ， 无 论 
是 利用 调查 数据 丰富 大 数据 资源 还 是 利用 大 数据 资源 丰富 调查 数据 
(我 们 可 以 用 任何 一 种 方式 看 待 该 研究 ) ， 都 有 巨大 的 价值 。 通 过 将 
两 个 数据 资源 相 结 合 ， 研 究 人 员 束 能 做 那些 如 果 只 有 调查 数据 或 只 有 
大 数据 资源 束 不 可 能 做 的 事情 。 其 次 ， 尽 管 汇总 后 的 商业 数据 ， 例 如 
Catalist 的 数据 ， 不 应 个 看 作 绝 对 真实 ， 但 在 有 些 情况 下 ， 这 些 数据 
也 是 有 用 的 。 怀 疑 论 者 有 时 会 将 这 些 汇总 后 的 商业 数据 与 绝对 真实 进 
行 比 较 ， 并 指出 这 些 数 据 资源 存在 看 人 不足。 但 就 这 一 情况 而 言 ， 怀 疑 
论 者 其 实 正在 做 错误 的 比较 ， 因 为 研究 人 员 使 用 的 所 有 数据 都 达 不 到 
绝对 真实 。 因 此 ， 比 较 好 的 做 法 是 ， 将 汇总 后 的 商业 数据 资源 与 其 他 
同样 会 有 错误 的 可 用 数据 资源 《例如 ， 受 访 者 自我 报告 的 投票 行为 ) 
进行 比较 。 最 后 ， 在 茶 些 情况 下 ， 研 究 人 员 可 能 会 从 许多 私人 公司 在 
搜集 和 统一 复杂 的 社会 数据 集 方 面 的 巨大 投资 中 获 番 。 


3.6.2 扩充 型 提问 


扩充 型 提问 会 通过 一 个 预测 模型 将 源 于 少数 人 的 调查 数据 与 源 于 
许多 人 的 一 个 大 数据 资源 结合 起 来 。 


将 调查 数据 和 大 数据 资源 结合 起 来 的 男 一 种 方法 ， 我 称 之 为 扩充 
型 提问 。 在 扩充 型 提问 中 ， 研 究 人 员 会 通过 一 个 预测 模型 将 少量 的 调 
查 数据 与 一 个 大 数据 资源 结合 起 来 ， 然 后 利用 结合 后 的 数据 得 出 评估 
结论 ， 这 些 评 估 结 论 的 规模 或 粒度 是 只 通过 调查 数据 或 大 数据 资源 不 
可 能 实现 的 。 扩 充 型 提问 的 一 个 重要 事例 是 乔 舒 亚 。 布 卢 门 斯 托 克 的 
研究 ， 他 想 搜 集 有 助 于 指导 贫穷 国家 发 展 的 数据 。 在 过 去 ， 搜 集 此 类 
数据 的 研究 人 员 一 般 只 能 采取 以 下 两 种 方法 中 的 一 种 : 抽样 调查 或 人 
口 普查 。 只 需要 研究 人 员 采 访 少量 人 的 抽样 调查 比较 灵活 、 及 时 且 成 
本 相对 较 低 ， 但 因 这 些 调查 是 基于 一 个 样本 的 ， 所 以 其 分 辨 率 通常 是 
有 限 的 。 也 就 是 说 ， 通 过 一 项 抽样 调查 ， 通 常 很 难 对 特定 的 地 理 区 域 
或 人 口 群 体 做 出 评估 。 而 人 口 普 查 则 试图 采访 每 一 个 人 ， 因 此 研究 人 
员 可 以 通过 人 口 普查 对 小 的 地 理 区 域 或 人 口 群体 进行 评估 。 但 人 口 普 
查 往 往 成 本 高 、 关 注 面 小 ( 它 只 包含 少量 的 问题 ， 而 且 不 及 时 CE 
按 固 定 的 时 间 表 进行 ， 例 如 每 隔 10 年 普查 一 次 ) (Kish 1979) 。 与 其 
勉强 接受 抽样 调查 或 是 人 口 普查 ， 研 究 人 员 还 不 如 设想 一 下 能 否 将 两 
种 方法 各 自 的 最 佳 特征 结合 起 来 ， 能 否 每 天 向 每 一 个 人 提出 每 一 个 问 
题 。 显 然 ， 这 种 无 处 不 在 的 、 不 间断 的 调查 只 是 一 种 社会 科学 幻想 。 
但 通过 将 源 于 少量 人 的 调查 问题 与 源 于 许多 人 的 数字 痕迹 相 结合 ， 
们 似乎 确实 可 以 接近 这 一 幻想 。 


布 卢 门 斯 托 元 的 研究 始 于 他 与 卢旺达 最 大 的 手机 供应 商 的 合作 ， 
该 供应 商 癌 其 提供 了 2005 一 2009 年 间 约 150 万 名 用 户 的 匿名 记录 。 这 些 
记录 含有 每 次 通话 和 每 条 短信 的 相关 信息 ， 例 如 起 始 时 间 、 持 续 时 间 
以 及 呼叫 方 和 接收 方 大 致 的 地 理 位置 。 在 我 谈论 统计 问题 之 前 ， 值 得 
指出 的 是 ， 获 取 数 据 这 第 一 步 对 许多 研究 人 员 来 说 可 能 是 最 难 的 步骤 
之 一 。 正 如 我 在 第 2 章 所 描述 的 ， 大 多 数 大 数据 资源 都 是 研究 人 员 难 以 
获取 的 。 电 话 元 数据 尤其 难以 获取 ， 因 为 它们 基本 上 是 不 可 能 被 “ 匿 
名 化 ”的 ， 而 且 几 平一 定 会 包含 参与 者 认为 敏感 的 信息 (Mayer, 
Mutchler, and Mitchell 2016; Landau 2016) 。 在 布 卢 门 斯 托 克 的 
研究 中 ， 研 究 人 员 在 保护 数据 方面 很 是 谨慎 ， 而 且 有 一 个 第 三 方 ( 即 


他 们 的 机 构 审查 委员 会 ) 负责 监督 他 们 的 工作 。 我 将 在 第 6 章 更 详细 地 
探 客 这 些 道德 伦理 问题 。 


布 户 门 斯 托 死 感 兴趣 的 是 衡量 财富 状况 和 幸福 感 ， 但 通话 记录 中 
并 没有 直接 记录 这 些 特性 。 换 人 句 话说 ， 对 该 研究 来 说 ， 这 些 通 话 记录 
共有 不 完整 性 ， 这 是 大 数据 资源 所 共有 的 一 个 特征 ， 在 第 2 章 中 我 详细 
介绍 过 这 一 点 。 但 通话 记录 很 可 能 包含 一 些 能 间接 提供 有 关 财 富 状况 
和 池 福 感 的 信息 内 容 。 鉴 于 这 种 可 能 性 ， 布 户 门 斯 托 元 想 ， 是 否 有 可 
能 训练 一 个 机 器 学 习 模 型 ， 该 模型 能 通过 通话 记录 预测 茶 个 人 在 一 项 
调查 中 会 如 何 作答 ? 如 果 这 是 可 行 的 ， 那 么 布 户 门 斯 托 克 就 能 利用 这 
一 模型 预测 150 万 名 用 户 的 调查 答案 。 


为 了 创建 和 训练 这 样 一 个 模型 ， 布 卢 门 斯 托 克 和 来 自 基 加 利 科学 
技术 研究 所 (Kigali Institute of Science and Technology) 的 研 
完 助 理 随机 抽取 了 约 1000 名 有 用户。 研究 人 员 辐 参与 者 解释 说 明了 研究 
的 目的 ， 并 就 将 调查 答案 与 通话 记录 结合 起 来 征求 了 他 们 的 同意 ， 然 
后 回 他 们 提 了 一 系列 的 问题 ， 以 衡量 其 财富 状况 和 幸福 感 ， 例 如 “你 
有 收音 机 吗 ? ”以 及 “你 有 自行 车 吗 ?””“【 部 分 问题 列表 参见 图 
3.14) 。 所 有 参与 调查 的 人 都 获得 了 经 济 报酬 。 


接 下 来 ， 布 户 门 斯 托 克 采用 了 机 器 学 习 中 常见 的 两 步 法 : 特征 工 
程 、 监 督 式 学 习 。 首 先 ， 在 特征 工程 这 一 步 中 ， 布 户 门 斯 托 殉 将 通话 
记录 转换 成 了 关于 每 个 受 访 者 的 一 组 特征 ， 数 据 科 学 家 可 能 会 称 这 些 
特征 为 “特征 ”， 而 社会 科学 家 则 可 能 称 之 为 “变量 ”。 例 如 ， 布 户 
门 斯 托 克 会 计算 出 每 个 人 的 总 活跃 天 数 、 联 系 过 的 人 不同 的 人 ) 的 
数量 以 及 通话 费 等 。 这 一 步 中 至 关 重 要 的 一 点 是 ， 好 的 特征 工程 需要 
研究 人 员 了 解 研究 环境 。 例 如 ， 如 果 区 分 国内 电话 和 国际 电话 很 重要 
我们 可 能 会 认为 打 国际 电话 的 人 更 富有 ) ， 那 么 这 一 工作 整 必 须 在 
特征 工程 这 一 步 进行 。 而 对 卢旺达 知之 甚 少 的 研究 人 员 可 能 就 不 会 考 
虑 这 一 特征 ， 模 型 的 预测 性 能 整 会 受到 影响 。 


图 3.14 用 通话 记录 训练 统计 模型 的 预测 精度 。 改 编 自 Blumenstock (2014) , #2. 
接 下 来 ， 在 监督 式 学 习 这 一 步 中 ， 布 卢 门 斯 托 克 创建 了 一 个 模 


型 ， 根 据 每 个 人 的 特征 预测 其 调查 答案 。 在 该 步骤 中 ， 布 户 门 斯 托 死 
采用 了 逻辑 回归 ， 但 其 实 他 也 可 以 采用 其 他 统计 或 机 器 学 习 方 法 。 


那么 该 模型 的 效果 如 何 呢 ? 根据 从 通话 记录 中 提取 的 特征 ， 布 户 
门 斯 托 区 是否 能 利用 该 模型 预测 用 户 对 诸如 “你 有 收音 机 吗 ?” ”以 及 
“你 有 自行 车 吗 ? ”的 调查 问题 的 回答 吗 ? 为 了 评估 其 预测 模型 的 性 
能 ， 布 卢 门 斯 托 区 采用 了 交叉 验证 ， 该 方法 在 数据 科学 中 很 常用 ， 但 
在 社会 科学 中 很 少 被 采用 。 交 叉 验 证 的 目的 是 公平 评估 一 个 模型 的 预 
汕 性 能 ， 做 法 是 利用 不 同 的 子 数据 集训 练 并 测试 该 模型 。 有 具体 来 说 ， 
布 户 门 斯 托 克 先 将 其 数据 分 成 了 10 组 ， 每 组 包含 100 人 的 数据 。 然 后 ， 
他 用 其 中 9 组 数据 来 训练 模型 ， 然 后 用 剩余 的 1 组 数据 来 评估 该 模型 的 
预测 性 能 。 他 将 这 一 过 程 重复 了 10 次 ， 每 次 选 1 组 不 同 的 数据 来 验证 模 
型 的 预测 性 能 ， 而 其 余 9 组 数据 则 用 于 训练 模型 ， 最 后 取 平 均值 。 


该 模型 对 某 些 特征 的 预测 精度 是 很 高 的 〈 图 3. 14) ， 例 如 预测 某 
人 是 否 有 收音 机 的 精确 度 能 达到 97. 6%。 这 听 起 来 可 能 很 不 错 ， 但 将 一 
个 复杂 的 预测 模型 与 一 个 简单 的 蔡 代 方法 进行 比较 通常 是 很 重要 的 。 
在 该 事例 中 ， 一 个 简单 的 替代 方法 就 是 预测 每 个 人 都 会 给 出 最 常见 的 
回答 。 例 如 ，97. 3% 的 受 访 者 回答 说 自己 有 收音 机 ， 因 此 ， 如 果 布 卢 门 
斯 托 元 预测 每 个 人 都 会 回答 说 自己 有 收音 机 ， 那 么 他 的 精确 度 就 是 
97. 3%， 这 与 他 更 复杂 的 预测 模型 的 表现 (97. 6% 的 精确 度 ) 竟 惊 人 地 
相似 。 换 句 话 说， 所 有 复杂 的 数据 和 建 模 工作 只 是 把 预测 精确 度 从 
97. 3% 提 高 到 了 97. 6%。 但 对 其 他 问题 ， 例 如 “你 有 自行 车 吗 ?”， 预 
测 精 确 度 就 从 54. 4% 提 高 到 了 67. 6%。 更 概括 地 说 ， 图 3. 15 表 明 ， 对 某 
些 特征 来 说 ， 相 比 于 简单 的 基线 预测 〈 即 预测 每 个 人 都 会 给 出 最 常见 
的 回答 ) ， 布 卢 门 斯 托 殉 的 模型 并 没有 明显 提高 精确 度 ， 但 对 其 他 一 
些 特征 来 说 还 是 有 些 改善 的 。 但 仅 从 这 些 结果 来 看 ， 你 可 能 会 觉得 这 
种 方法 并 不 是 特别 有 前 景 。 
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图 3.15 利用 通话 记录 训练 的 统计 模型 的 预测 精度 与 简单 的 基线 预测 的 预测 精度 的 对 
比 。 为 了 放免 重 登 ， 有 的 数值 有 轻微 调整 。 改 编 自 Blumenstock (2014) , #2. 


然而 ， 仅 仅 一 年 后 ， 布 卢 门 斯 托 区 和 两 位 同事 ， 加 布 里 顽 尔 。 卡 
达 称 罗 (Gabriel Cadamuro) AUS 1BR © $ (Robert On) ， 就 大 大 改 
进 了 研究 结果 (Blumenstock, Cadamuro, and On 2015) ， 并 在 《 科 
学 》 杂 志 上 发 表 了 他 们 的 论文 。 这 一 改进 主要 有 两 个 技术 原因 : (1) 
他 们 采用 了 更 复杂 的 方法 ( 即 在 特征 工程 这 一 步 中 采用 了 新 的 方法 ， 
并 创建 了 更 复杂 的 模型 来 利用 特征 预测 回答 ) ; E) 他 们 不 再 试图 推 
斯 单个 调查 问题 〈 例 如 ，“ 你 有 收音 机 吗 ?”) 的 答案 ， 而 是 试图 推 
斯 综合 财富 指数 。 这 些 技术 上 的 改进 意味 着 他 们 可 以 合理 地 利用 通话 
记录 预测 样本 中 用 户 的 财富 状况 。 


但 预测 样本 中 用 户 的 财富 状况 并 不 是 他 们 研究 的 最 终 目 标 ， 他 们 
的 最 终 目标 是 将 抽样 调查 和 人 口 普 碍 各 目的 最 佳 特征 结合 起 来 ， 从 而 
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据 预 测 了 150 万 名 用 户 的 财富 状况 。 他 们 还 利用 通话 记录 中 的 位 置信 息 
(通话 记录 中 有 每 次 通话 时 用 户 离 得 最 近 的 手机 信号 塔 的 位 置 ) 评估 
了 每 个 人 大 致 的 居住 地 《〈 图 3. 16) 。 通 过 将 这 两 项 评估 结合 在 一 起 ， 
布 户 门 斯 托 克 和 同事 得 出 的 评估 结论 ， 是 关于 用 户 财 是 地 理 分 布 的 极 
细 粒 度 〈 指 空间 粒度 〉 的 。 例 如 ， 他 们 能 够 估算 出 户 旺 达 2148 个 街区 
中 每 一 个 街区 的 平均 财富 状况 。 


那么 这 些 评估 结论 与 该 地 区 的 真实 贫困 水 平 的 符合 程度 如 何 呢 ? 
在 回答 这 个 问题 之 前 ， 我 想 强 调 一 个 事实 ， 那 就 是 大 家 有 很 多 理由 持 
怀疑 态度 。 例 如 ， 在 个 体 层 面 上 进行 的 预测 ， 其 结果 相当 参差 不 齐 
(13.1 。 此 外 ， 也 许 更 重要 的 一 点 是 ， 有 手机 的 人 与 没有 手机 的 
人 可 能 会 有 系统 性 的 差别 。 因 此 ， 布 户 门 斯 托 元 和 同事 可 能 也 会 受到 
履 盖 面 误差 的 困扰 ， 类 似 于 我 之 前 所 摘 述 的 1936 年 《文学 文摘 》 的 调 
fs 


为 了 了 解 他 们 评估 结论 的 质量 ， 布 卢 门 斯 托 元 和 同事 需要 将 其 数 
所 与 其 他 东西 进行 比较 。 幸 运 的 是 ， 就 在 他 们 进行 该 项 研究 的 同时 ， 
另 一 组 研究 人 员 也 正在 卢旺达 进行 一 项 传统 的 社会 调 碍 。 这 项 调查 是 
广 受 重视 的 人 口 统计 和 健康 调查 的 一 部 分 ， 拥 有 大 量 预算 ， 采 用 的 是 
高 质量 的 传统 方法 。 因 此 ， 人 口 统 计 和 健康 调查 的 评估 结论 可 以 被 合 
理 地 认为 是 黄金 标准 。 人 们 将 这 两 种 评估 进行 比较 后 发 现 ， 它 们 非常 
相似 “图 3.17) 。 换 名 话说 ， 通 过 将 少量 调 碍 数据 与 通话 记录 结合 起 
来 ， 布 户 门 斯 托 元 和 同事 得 出 了 与 采用 黄金 标准 的 方法 所 得 出 的 评估 
结论 相 类 似 的 结论 。 


预测 


人 一 特征 矩阵 模型 


特征 
[ 程 师 


预测 的 


: 调查 数据 
人 一 特征 矩阵 调查 数据 


图 3.16 布 卢 门 斯 托 克 、 卡 达 穆 罗 以 及 丛 的 研究 示意 图 。 首 先 ， 他 们 将 手机 供应 商 的 
通话 记录 转换 成 了 算 阵 ， 其 中 每 个 人 占 一 行 ， 每 个 特征 〈 即 变量 ) 占 一 列 。 接 下 
来 ， 他 们 创建 了 一 个 监督 式 学 习 模 型 ， 以 通过 上 述 和 矩阵 预测 调查 答案 。 然 后 ， 他 们 
利用 该 模型 预测 150 万 名 用 户 的 调查 答案 。 此 外 ， 他 们 还 根据 这 些 用 户 打 电 话 时 的 位 
置 评 估 了 150 万 名 用 户 大 致 的 居住 地 。 在 把 这 两 项 评估 ， 即 财富 状况 和 居住 地 ， 结 合 
起 来 后 ， 其 结果 与 人 口 统计 和 健康 调查 的 评估 结果 很 相似 ， 而 人 口 统 计 和 健康 调查 
被 认为 是 黄金 标准 的 传统 调查 。 
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图 3.17 布 卢 门 斯 托 克 、 卡 达 穆 罗 以 及 丛 的 研究 结果 。 在 个 体 层 面 上 ， 研 究 人 员 能 通 
过 某 人 的 通话 记录 来 合理 预测 其 财富 状况 。 基 于 个 体 层 面 的 财富 状况 和 居住 地 的 评 
估 所 得 出 的 卢旺达 30 个 地 区 的 地 区 级 财富 状况 评估 ， 与 人 口 统计 和 健康 调查 的 评估 
结果 很 相似 ， 而 人 口 统 计 和 健康 调查 被 认为 是 黄金 标准 的 传统 调查 。 改 编 自 
Blumenstock, Cadamuro, and On (2015) ， 图 1a 和 图 3c。 


持 怀疑 态度 的 人 可 能 会 认为 这 些 结果 是 令 人 失望 的 。 毕 竟 ， 对 布 
户 门 斯 托 元 和 同事 的 研究 的 一 种 解读 方式 是 ， 利 用 现 有 的 方法 能 更 可 
徘 地 得 出 他 们 通过 大 数据 和 机 器 学 习 所 得 出 的 评估 结论 。 但 我 认为 这 
并 不 是 解读 该 研究 的 正确 方式 ， 原 因 有 以 下 两 点 。 首 先 ， 相 比 于 现 有 
的 方法 ， 布 户 门 斯 托 元 和 同事 得 出 评估 结论 所 采用 的 方法 要 快 10 售 ， 
成 本 降 为 1/50《〈 以 可 变 成 本 计算 ) 。 正 如 我 在 上 文 所 论述 的 一 样 ， 研 
完 人 员 忽 视 成 本 问题 可 能 会 给 自己 带 来 麻烦 。 就 拿 布 上 户 门 斯 托 元 和 同 
事 的 研究 为 例 ， 相 比 于 每 隅 几 年 开展 一 次 〈 这 是 该 调 碍 的 一 个 标准 ) 
的 人 口 统 计 和 健康 调查 ， 布 卢 门 斯 托 元 和 同事 在 成 本 上 的 巨大 优势 意 
味 着 他 们 每 个 月 都 可 以 开展 这 样 的 研究 ， 这 将 为 研究 人 员 和 决策 者 带 
来 诸多 好 处 。 其 次 ， 该 研究 采取 的 方法 经 调整 后 可 以 被 用 于 许多 不 同 
的 研究 。 该 方法 仅 需 要 两 类 资源 及 两 个 步骤 。 这 两 类 资源 分 别 是 : 
(1) 三 而 薄 的 大 数据 资源 〈 即 该 资源 包含 许多 人 ， 但 没有 你 需要 的 关 


于 每 个 人 的 信息 ) ; (2) 罕 而 厚 的 调查 数据 《〈 即 该 数据 只 包含 少量 
人 ， 但 其 中 有 你 需要 的 关于 这 些 人 的 信息 ) 。 然 后 需要 用 两 步 把 这 些 
资源 结合 起 来 。 首 先 ， 为 两 个 数据 资源 中 的 人 创建 一 个 机 需 学 习 模 
型 ， 该 模型 可 以 利用 数字 痕迹 了 预测 调查 答案 。 然 后 ， 用 该 模型 推 朵 上 
述 大 数据 资源 中 每 个 人 的 调查 答案 。 因 此 ， 如 果 你 有 一 些 问题 想 问 很 
多 人 ， 那 就 可 以 找 一 个 有 关 这 些 人 的 大 数据 资源 ， 哪 怕 是 你 不 感 兴趣 
的 大 数据 资源 也 行 ， 因 为 它 也 许 能 预测 这 些 人 将 如 何 回答 你 的 问题 。 
也 就 是 说 ， 布 上 户 门 斯 托 元 和 同事 最 初 并 不 是 关心 通话 记录 ， 他 们 之 所 
以 留意 这 些 通话 记录 ， 是 因为 其 可 以 预测 他 们 真正 关心 的 调查 答案 。 
扩充 型 提问 有 别 于 我 之 前 描述 过 的 租 入 式 提问 ， 你 只 需要 对 大 数据 资 
源 有 非 直 接 的 兴趣 即 可 。 


综 上 所 述 ， 布 卢 门 斯 托 克 通过 采用 扩充 型 提问 得 出 的 结论 与 符合 
黄金 标准 的 调查 评估 结论 类 似 。 该 研究 事例 也 阐明 了 扩充 型 提问 和 传 
统 的 调查 方法 各 自 存 在 的 利 次。 利用 扩充 型 提问 进行 评估 更 及 时 ， 具 
有 了 明显 的 成 本 优势 ， 且 得 出 的 结论 粒度 更 细 。 但 这 类 扩充 型 提问 目前 
还 没有 很 强 的 理论 基础 。 仅 赁 这 一 个 事例 并 不 能 说 明 该 方法 何 时 有 
效 、 何 时 无 效 ， 而 且 使 用 该 方法 的 研究 人 员 需 格外 注意 因 所 使 用 的 大 
数据 资源 包含 某 些 人 而 未 包含 男 外 一 些 人 而 可 能 导致 的 偏差 。 此 外 ， 
扩充 型 提问 目前 还 没有 好 的 方法 来 量化 其 评估 结论 的 不 确定 性 。 幸 运 
的 是 ， 扩 充 型 提问 与 统计 学 中 的 三 大 领域 有 着 很 深 的 关联 。 这 三 大 领 
域 分 别 是 小 区 域 估 计 (Rao and Molina 2015) 、 填 补 法 (Rubin 
2004) 以 及 基于 模型 的 事后 分 层 ( 该 领域 与 我 在 前 面 介绍 的 “P 先 生 ” 
这 一 方法 紧密 相关 ) 。 鉴 于 这 些 很 深 的 关联 性 ， 我 预计 扩充 型 提问 的 
许多 方法 论 基础 都 将 很 快 得 到 增强 。 


最 后 ， 通 过 对 比 布 户 门 斯 托 克 的 第 一 次 和 第 二 次 尝试 ， 我 们 还 能 
学 到 有 关 数 字 时 代 社 会 研究 的 一 个 重要 经 验 : 开始 并 不 是 结束 。 也 就 
是 说 ， 许 多 时 候 ， 第 一 次 的 方法 可 能 并 不 是 最 好 的 ， 但 如 末 研 究 人 员 
继续 努力 ， 情 况 就 会 变 得 更 好 。 更 广泛 地 说 ， 在 评估 数字 时 代 社 会 研 


完 的 新 方法 时 ， 进 行 以 下 两 项 截然 不 同 的 评估 是 很 重要 的 : (1) 该 方 
法 在 当下 的 效果 如 何 ? (2) 随 着 数据 概况 的 改变 以 及 研究 人 员 投 入 更 
多 的 关注 在 这 个 问题 上 ， 该 方法 的 效果 又 将 如 何 ? 尽管 研究 人 员 接 受 
过 第 一 类 评估 的 培训 (评估 一 项 特定 研究 的 好 坏 〉》， 但 第 二 类 评估 往 
往 更 为 重要 。 


3.7 结论 


从 模拟 时 代 到 数字 时 代 的 转变 正在 为 调查 研究 人 员 创 造 新 的 机 
会 。 在 本 章 中 ， 我 提出 大 数据 资源 不 会 取代 调查 ， 而 且 其 丰富 性 还 将 
提升 而 不 是 降低 调查 的 价值 (3. 2 节 ) 。 然 后 ， 我 总 结 了 在 调查 研究 的 
前 两 个 时 代 发 展 起 来 的 调查 误差 总 框架 ， 该 框架 有 助 于 研究 人 员 开 发 
和 评估 调查 研究 第 三 个 时 代 的 方法 〈3. 3 节 ) 。 我 预计 会 出 现 令 人 兴奋 
的 机 会 的 三 个 领域 分 别 是 : (1) 非 概率 抽样 (3. 4m) ， (2) 计算 机 
管理 的 调查 (3.5 节 ) , (3) 将 调查 和 大 数据 资源 结合 起 来 (3.6 
节 ) 。 技 术 和 社会 方面 的 变化 驱动 着 调查 研究 不 断 地 向 前 发 展 。 我 们 
应 该 拥抱 这 一 发 展 趋势 ， 并 继续 从 之 前 的 时 代 汲 取 智 慧 。 


4.4 超越 简单 实验 


让 我 们 从 以 下 三 个 概念 入 手 来 实现 从 简单 实验 到 丰富 实验 的 突 
破 : 效 度 、 处 理 效应 的 异 质 性 和 原理 。 


刚 开 始 做 实验 的 研究 者 往往 会 把 注意 力 集中 在 一 个 具体 的 、 范 围 
狭小 的 问题 上 : 这 个 处 理 能 “起 作用 ” 吗 ? 例如 ， 一 个 志愿 者 打 来 的 
电话 能 促使 一 个 人 投票 吗 ? 将 网 站 按钮 从 赣 色 换 成 绿色 能 增加 广告 的 
点 击 率 吗 ? 不 过 遗憾 的 是 ， 对 于 “起 作用 ”的 不 严谨 的 措辞 掩盖 了 这 
样 一 个 事实 ， 即 研究 范围 狭隘 的 实验 是 无 法 真正 反映 一 个 处 理 是 人 否 能 
够 在 一 般 意 义 上 “起 作用 ”的 。 相 反 ， 该 类 型 实验 其 实 是 为 了 回答 一 
个 更 具体 的 问题 : 在 特定 的 时 间 对 特定 数量 的 参与 者 进行 此 次 特定 的 
实验 ， 会 产生 怎样 的 平均 效应 呢 ? 我 个 人 会 把 以 这 种 范围 狭小 的 问题 
作为 出 发 点 的 实验 称 为 简单 实验 。 


简单 实验 能 够 提供 有 价值 的 信息 ， 但 无 法 回答 许多 重要 且 有 趣 的 
问题 ， 例 如 是 否 有 人 会 对 茶 一 处 理 表现 出 比 别 人 更 为 明显 或 更 不 易 被 
察觉 的 反应 ; 是 否 有 为 一 个 更 为 有 效 的 处 理 方 采 ; 以 及 这 一 实验 是 否 
涉及 更 广泛 的 社会 理论 。 


接 下 来 ， 我 将 通过 韦 斯 利 ， 舒 尔 尝 (Wesley Schultz) 及 其 同事 
在 2007 年 针对 社会 规范 与 用 电量 之 间 的 关系 所 开展 的 模拟 实地 实验 来 
说 明 超 越 简 单 实验 的 价值 所 在 。 实 验 中 ， 舒 尔 将 和 同事 选取 了 位 于 圣 
马 科 斯 和 加 利 福 尼 亚 州 的 约 300 个 家 庭 作 为 实验 对 象 ， 并 在 他 们 家 门 前 
挂 上 了 写 有 鼓励 人 们 节约 用 电 的 信息 的 门 挂牌 。 然 后 ， 舒 尔 交 和 同事 
分 别 在 一 周 后 和 三 周 后 测量 了 这 些 信息 对 用 电量 的 影响 。 更 详细 的 实 
验 设计 描述 参见 图 4. 3. 


实验 是 在 两 种 不 同 的 实验 条 件 下 开展 的 。 在 第 一 种 实验 条 件 下 ， 
实验 对 象 收 到 的 是 一 般 的 节能 建议 《例如 使 用 风扇 而 不 是 空调 》 和 他 
们 各 自 的 用 电 情 况 与 所 在 小 区 的 平均 用 电 情 况 的 对 比 信 息 。 和 舒 尔 菊 和 
同事 称 该 实验 条 件 为 描述 性 规范 实验 条 件 ， 因 为 该 小 区 的 用 电 情 况 体 
现 了 一 种 典型 行为 〈 即 描述 性 规范 ) 。 舒 尔 次 和 同事 在 研究 实施 处 理 
后 该 被 测 群体 的 用 电 情 况 时 发 现 ， 无 论 从 短期 还 是 长 期 来 看 ， 这 一 处 
理 似 乎 都 没有 任何 效果 。 换 言 之 ， 这 一 处 理 似 乎 并 不 能 够 “起 作用 ” 
(图 4. 4) 。 
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访 圣 马 科斯 和 加 利 福 尼 亚 州 约 300 个 家 庭 。 每 次 拜访 时 ， 研 究 人 员 都 需 手 动 记录 下 相 
应 家 庭 电 表 的 读数 。 在 其 中 的 两 次 拜访 中 ， 他 们 还 需 将 写 有 家 庭 用 电 情况 的 门 挂牌 
挂 在 相应 家 庭 的 门 上 。 该 项 实验 的 研究 课题 是 ， 这 些 信息 的 内 容 如何 影 响 居民 用 电 
E. 


幸运 的 是 ， 舒 尔 软 和 同事 并 没有 满足 于 这 一 简单 的 分 析 。 其 实在 
实验 开始 前 ， 他 们 曾 推 断 ， 用 电量 大 的 居民 ， 即 高 于 平均 用 量 的 大 
民 ， 其 用 电量 可 能 会 减少 ， 而 用 电量 小 的 居民 ， 即 低 于 平均 用 量 的 大 
民 ， 其 用 电量 则 可 能 会 增加 。 然 后 当 他 们 仔细 研究 具体 数据 时 发 现 ， 
的 确 是 这 样 的 “图 4. 4) 。 因 此 ， 看 起 来 没有 任何 效果 的 处 理 ， 实 际 上 
是 产生 了 两 个 相互 抵消 的 效果 。 其 中 在 低 用 电量 群体 中 所 产生 的 适 得 
其 反 的 上 涨 效 果 则 是 “ 飞 去 来 占 效 应 ”的 一 个 例子 ， 即 菜 一 处 理 产 生 
了 与 原 目标 相反 的 效应 。 


第 二 种 实验 条 件 下 的 实验 与 第 一 种 是 同时 进行 的 。 在 该 实验 条 件 
下 ， 被 测 家 性 收 到 了 几乎 完全 相同 的 门 挂牌 ， 上 面 写 有 一 般 节 能 建议 
和 他 们 各 自 的 用 电 情 况 与 所 在 小 区 的 平均 用 电 情 况 的 对 比 信息 ， 不 过 
还 增加 了 一 个 小 细节 : 对 于 低 用 电量 居民 ， 研 究 人 员 会 额外 附 上 表情 
FSO; MIRA SER, HARMS AEC. KHER 
符号 旨 在 运用 研究 人 员 所 称 的 指令 性 规范 。 指 令 性 规范 旨 在 表明 什么 
是 被 人 们 赞同 《或 者 不 赞同 ) 的 行为 ， 而 描述 性 规范 旨 在 表明 人 们 应 
该 做 什么 〈Reno，Cialdini and Kallgren 1993) 。 


通过 加 上 这 个 小 小 的 表情 符号 ， 研 究 人 员 大 大 减轻 了 在 低 用 电量 
居民 中 所 出 现 的 “ 飞 去 来 器 效应 ”图 4.4) 。 因 此 ， 这 一 简单 的 改变 
(受到 一 个 抽象 的 社会 心理 学 理论 的 局 发 ) 使 原本 似乎 不 可 行 的 项 目 
变 得 可 行 了 ， 与 此 同时 ， 这 一 实验 还 能 使 人 们 更 进一步 地 理解 社会 规 
范 是 如 何 影响 人 类 行为 的 。 


描述 性 规范 描述 性 规范 描述 性 + 指令 性 规范 
2 
la 
2 
EN 
pS 
1 Jal 3 周 1 周 3 周 1 周 3 周 


处 理 前 的 用 电量 : 
4 所 有 居民 低 于 平均 用 量 的 居民 v 高 于 平均 用 量 的 居民 


图 4.4 舒 尔 蒋 等 人 的 研究 结果 。 图 中 第 一 栏 表 明 ， 描 述 性 规范 所 产生 的 平均 处 理 效 
应 《 即 对 被 测 群体 整体 用 电量 的 影响 ) 几乎 为 零 。 但 是 ， 第 二 栏 表明 ， 该 平均 处 理 
效应 实际 上 包含 了 两 种 相互 抵消 的 效应 。 对 于 高 用 电量 居民 ， 描 述 性 规范 会 降低 他 
们 的 用 电量 ， 但 是 对 于 低 用 电量 居民 ， 描 述 性 规范 反而 会 增加 他 们 的 用 电量 。 最 

后 ， 第 三 栏 表明 ， 第 二 种 处 理 ， 即 同时 运用 描述 性 和 指令 性 规范 ， 对 高 用 电量 居民 
产生 的 影响 与 第 一 种 处 理 几乎 相同 ， 但 是 减轻 了 在 低 用 电量 居民 中 所 出 现 的 “ 飞 去 
来 器 效应 ”。 该 图 根据 舒 尔 英 等 人 的 研究 结果 绘制 。 


然而 ， 你 也 可 能 会 友 现 ， 舒 尔 次 及 其 同事 的 实验 与 其 他 实验 有 一 
点 不 同 。 那 就 是 ， 这 个 实验 并 没有 像 随 机 对 照 实 验 那 样 有 一 个 对 照 
组 。 其 实 通 过 对 比 该 实验 设计 跟 雷 斯 带 湛 和 范 德 里 杰 特 的 实验 设计 ， 
就 能 阐明 以 下 两 种 主要 实验 设计 的 差异 。 在 “被 试 则 ”设计 中 ， 比 如 
雷 斯 带 沃 和 范 德 里 杰 特 的 实验 设计 ， 会 设置 一 个 实验 组 和 一 个 对 照 
组 。 但 在 “被 试 内 ”设计 中 ， 则 是 把 参与 者 在 接受 实验 处 理 前 和 后 的 
行为 做 对 比 (Greenwald 1976; Charness, Gneezy, and Kuhn 
2012) 。 在 采用 被 试 内 设计 的 实验 中 ， 每 个 参与 者 似乎 同时 也 是 自己 
的 对 照 组 。 被 试 间 设 计 的 优势 在 于 降低 了 混 汪 变量 的 干扰 (正如 我 在 
前 文中 提 及 的 ) ， 而 被 试 内 设计 的 优势 则 在 于 提高 了 估计 结果 的 准确 
性 。 然 后 ， 在 后 面 的 章节 中 我 会 针对 如 何 设计 数字 实验 给 出 建议 ， 其 
中 就 会 涉及 混合 设计 ， 该 设计 融合 了 被 试 内 设计 的 高 准确 度 以 及 被 试 
间 设 计 的 低 干 扰 性 〈 见 图 4.5) 。 


总 的 来 说 ， 千 尔 次 及 其 同事 的 实验 的 设计 和 结果 都 次 明了 超越 简 
单 实验 的 价值 。 幸 运 的 是 ， 并 非 只 有 创造 性 的 天 才 才 能 设计 出 这 样 的 
实验 。 社 会 科学 家 已 经 提出 了 三 个 理念 来 指导 我 们 设计 出 更 丰富 的 实 
验 : (1) BORE; (2) 处 理 效应 的 异 质 性 ; (3) 原理 。 也 就 是 将， 如 
果 你 在 设计 实验 的 时 候 牢记 这 三 个 理念 ， 那 么 你 自然 而 然 地 会 设计 出 
一 个 更 有 趣 有 用 的 实验 。 舒 尔 次 及 其 同事 精妙 的 实验 设计 和 令 人 兴奋 
的 成 果 启 发 了 一 系列 在 部 分 程度 上 可 以 算 作 数 字 化 的 实地 实验 ， 我 将 
通过 对 这 些 后 续 实 验 进行 描述 来 进一步 前 明 应 该 如 何 应 用 这 三 个 理 
念 。 然 后 你 会 发 现 ， 通 过 更 为 细致 的 设计 、 实 施 、 分 析 和 解读 ， 你 也 
能 够 实现 从 简单 实验 到 丰富 实验 的 突破 。 


| 


实验 组 对 比 和 
被 试 间 设 i 对 照 组 
被 试 间 设 计 
参与 者 
对 照 组 
对 比 处 理 前 和 
处 理 后 
被 试 内 设计 
参与 者 处 理 前 处 理 后 
处 理 前 实验 组 
混合 设计 对 比 实验 组 变化 
=— 和 对 照 组 变化 
处 理 前 对 照 组 


图 4.5 上 图 为 三 种 实验 设计 。 首 先 ， 标 准 的 随机 对 照 实验 采用 的 是 被 武 间 设 计 。 采 
用 被 武 间 设计 的 实验 的 一 个 典型 例子 就 是 雷 斯 蒂 沃 和 范 德 里 杰 特 进行 的 实验 ， 该 实 
验 旨 在 研究 谷 仓 之 星 与 用 户 对 维基 百科 的 贡献 之 间 的 关系 : 研究 人 员 把 参与 者 随机 
分 为 实验 组 和 对 照 组 ， 并 给 实验 组 的 参与 者 每 人 一 枚 谷 仓 之 星 ， 然 后 比较 两 组 的 结 
果 。 第 二 种 实验 设计 是 被 试 内 设计 。 舒 尔 茨 及 其 同事 进行 的 两 个 关于 社会 规范 和 用 
电量 间 关 系 的 实验 就 用 到 了 被 试 内 设计 : 研究 人 员 对 比 了 参与 者 在 接受 处 理 前 和 接 
受 处 理 后 的 用 电量 。 被 试 内 设计 有 利于 提高 统计 数据 的 准确 性 ， 但 是 可 能 受到 混 清 
变量 的 干扰 《比如 处 理 前 和 处 理 期 间 的 天 气 变 化 ) (Greenwald 1976; Charness, 
Gneezy, and Kuhn 2012) 。 被 试 内 设计 有 时 也 被 称 为 重复 测量 设计 。 最 后 是 混合 设 
计 ， 它 兼备 了 被 试 内 设计 的 高 准确 度 和 被 试 间 设计 的 低 干 扰 性 。 在 混合 设计 中 ， 研 
完 人 员 会 比较 实验 组 和 对 照 组 的 结果 变化 。 如 果 研 究 人 员 已 经 掌握 了 处 理 前 信息 
(在 许多 数字 实验 中 都 是 这 样 的 ) ， 混 合 设 计 通 常 比 被 试 间 设 计 更 可 取 ， 因 为 前 者 
能 够 提高 估计 结果 的 精确 度 。 


4. 4. 1 效 度 


没有 一 个 实验 是 完美 的 ， 研 究 人 员 创 造 了 大 量 的 词汇 来 描述 可 能 
出 现 的 问题 。 效 度 是 指 某 一 实验 的 结果 符合 某 个 一 般 性 结论 的 程度 。 
社会 科学 家 发 现 可 以 将 效 度 分 成 4 种 主要 类 型 : 统计 结论 效 度 、 内 部 效 
度 、 构 念 效 度 和 外 部 效 度 (Shadish，Cook，and Campbell 2001, 
chapter2) 。 掌 握 这 些 理念 之 后 ， 你 在 评价 和 改进 实验 的 设计 和 对 实 
验 进行 分 析 时 ， 心 里 就 有 谱 儿 了 ， 而 且 它 也 会 方便 你 和 其 他 研究 人 员 
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统计 结论 效 度 的 核心 在 于 对 实验 进行 的 统计 分 析 是 否 正确 。 在 舒 
尔 次 及 其 同事 的 实验 中 ， 该 效 度 的 核心 可 能 就 是 他 们 是 否 正 确 地 计算 
了 P 值 ( 尖 。 设 计 和 分 析 实 验 所 需 的 统计 原则 不 在 本 书 的 内 容 范畴 内 ， 
但 数字 时 代 的 到 来 并 没有 让 这 些 原则 发 生根 本 的 改变 。 发 生 改 变 的 是 
数字 实验 的 数据 环境 ， 它 创造 了 新 的 可 能 性 ， 例 如 利用 机 器 学 习 模 型 
评估 处 理 效 应 的 异 质 性 (Imai and Ratkovic 2013) 。 


内 部 效 度 的 核心 是 实验 步骤 是 人 否 被 正确 地 完成 。 在 舒 尔 次 及 其 同 
事 的 实验 中 ， 该 效 度 的 核心 可 能 就 是 随机 分 组 、 实 施 处 理 和 测量 结 
果 。 例 如 ， 你 可 能 会 担心 研究 助理 的 电表 读数 不 准确 。 事 实 上 ， 舒 尔 
次 和 同事 也 很 担心 这 个 问题 ， 于 是 他 们 让 助理 把 部 分 电表 读 了 两 次 ， 
幸运 的 是 ， 两 次 的 读数 基本 一 致 。 总 的 来 说 ， 舒 尔 菊 和 同事 的 实验 的 
内 部 效 度 似乎 很 高 ， 但 并 不 是 所 有 实验 都 是 这 样 : 复杂 的 实地 实验 和 
在 线 实验 在 对 正确 的 人 实施 正确 的 处 理 和 测量 每 个 人 的 结果 方面 ， 实 
际 上 经 常会 出 现 问 题 。 幸 运 的 是 ， 数 字 时 代 有 助 于 减少 对 内 部 效 度 的 
担忧 ， 因 为 在 数字 时 代 ， 确 保 对 参与 者 实施 处 理 以 及 测量 所 有 参与 者 
的 结果 变 得 更 加 容易 了 。 


构 念 效 度 的 核心 是 数据 和 理论 构 念 的 匹配 。 正 如 第 2 章 所 讨论 的 ， 
构 念 是 社会 科学 家 所 论证 的 抽象 概念 。 不 幸 的 是 ， 这 些 抽象 概念 并 不 


总 是 有 明确 的 定义 和 度量 。 在 舒 尔 茨 等 人 的 实验 中 ， 要 想 证 明 “ 指 令 
性 规范 能 够 降低 用 电量 ”这 一 观点 ， 需 要 研究 人 员 设 计 一 个 能 很 好 地 
代表 指令 性 规范 的 处 理 方式 《例如 添加 一 个 表情 符号 ) ， 并 测量 用 电 
量 。 在 模拟 实验 中 ， 许 多 研究 人 员 都 是 自行 设计 目 己 的 处 理 方 式 并 测 
量 自己 的 结果 。 这 一 方法 尽 可 能 地 确保 了 实验 与 所 研究 的 抽象 构 念 相 
匹配 。 在 数字 实验 中 ， 研 究 人 员 则 通过 与 企业 或 政府 合作 来 实施 处 
理 ， 并 利用 不 间断 运行 的 数据 系统 来 测量 结果 ， 所 以 实验 和 理论 构 念 
之 间 的 匹配 可 能 没有 那么 紧密 。 因 此 ， 我 认为 相 比 于 模拟 实验 ， 数 字 
实验 的 构 念 效 度 会 更 令 人 担忧。 


最 后 ， 外 部 效 度 的 核心 是 该 实验 的 结果 能 否 被 推广 到 其 他 情境 
中 。 就 祝 尔 次 等 人 的 实验 而 言 ， 人 们 可 能 会 问 ， 如 果 在 不 同 的 情境 中 
以 不 同 的 方式 进行 实验 ， 那 么 给 人 们 提供 关于 他 们 用 电 情 况 与 所 在 小 
区 的 平均 用 电 情 况 的 对 比 信息 和 一 个 代表 指令 性 规范 的 信号 《例如 一 
个 表情 符号 ) 还 能 减少 用 电量 吗 ? 对 于 大 多 数 精心 设计 、 步 又 正确 的 
实验 来 说 ， 对 外 部 效 度 的 担忧 是 最 难 解决 的 。 在 过 去 ， 有 关外 部 效 度 
的 争论 通常 都 只 是 一 群 人 坐 在 一 个 房间 里 面 ， 然 后 努力 去 想 如 果 以 不 
同 的 方式 完成 实验 步骤 ， 或 是 在 一 个 不 同 的 地 方 开展 实验 ， 或 是 有 不 
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再 进行 这 些 缺 乏 数据 文 撑 的 猜测 了 ， 他 们 可 以 通过 实证 来 评估 外 部 效 
度 。 


因为 等 尔 奖 等 人 的 研究 结果 非常 令 人 兴奋 ， 所 以 欧 电 公司 
COpower ) 与 美国 的 公用 事业 单位 联手 对 更 多 的 住户 实施 了 这 一 处 
理 。 根 据 舒 尔 次 等 人 的 设计 ， 欧 电 公 司 创建 了 包含 两 个 主要 模块 的 个 
性 化 家 星 能 源 报告 ， 其 中 一 个 模块 显示 某 一 住户 相 比 于 其 邻居 的 用 电 
量 情 况 ， 同 时 会 附 上 一 个 相应 的 表情 符 写 ， 为 一 个 模块 则 提供 有 关 减 
少 用 电量 的 建议 (图 4.6) 。 然 后 ， 欧 电 公 司 与 研究 人 员 一 起 开展 了 随 
机 对 照 实 验 ， 以 评估 这 些 家 性 能 源 报告 的 影响 。 尺 管 这 些 实验 的 处 理 
基本 都 是 以 非 数 字 化 的 方式 (通常 是 通过 传统 的 信件 邮寄 实施 的 ， 


但 对 结果 的 测量 都 是 在 物理 世界 使 用 数字 设备 进行 的 (例如 使 用 电 
4) 。 此 外 ， 欧 电 公 司 在 实验 过 程 中 还 与 电力 公司 进行 了 合作 ， 使 得 
研究 人 员 能 够 直接 访问 电力 公司 的 电力 数据 ， 而 无 须 让 研究 助理 挨家 
挨户 去 搜集 这 些 信 息 。 因 此 ， 欧 电 公 司 和 合作 伙伴 以 低 可 变 成 本 的 方 
式 在 大 规模 范围 内 成 功 地 开展 了 这 些 半 数字 实地 实验 。 


在 最 开始 针对 10 个 不 同 地 点 的 60 万 户 家 庭 进行 的 一 组 实验 中 ， 阿 
尔 科 特 (Allcott) 发 现 ， 家 庭 能 源 报告 能 够 降低 用 电量 。 换 句 话说 ， 
这 项 规模 更 大 的 、 涉 及 地 理 区 域 更 多 样 化 的 研究 所 得 出 的 结果 与 舒 尔 
次 等 人 的 结果 在 本 质 上 是 相似 的 。 然 后 ， 在 涉及 101 个 不 同 地 点 的 800 
万 户 家 庭 的 后 续 研 究 中 ， 阿 尔 科 特 再 次 发 现 了 家 庭 能 源 报告 能 够 降低 
用 电量 。 但 这 一 组 更 大 规模 的 实验 也 揭示 了 一 个 有 趣 的 新 规律 ， 在 后 
来 的 实验 中 ， 家 庭 能 源 报告 对 用 电量 的 影响 减 小 了 【〔 图 4.7) ， 这 一 规 
律 在 任何 单个 的 实验 中 都 是 无 法 被 发 现 的 。 阿 尔 科 特 推测 影响 减 小 的 
原因 是 随 着 时 间 的 推移 ， 接 受 处 理 的 参与 者 的 类 型 不 同 了 。 更 具体 地 
说 ， 客 户 环保 意识 越 强 的 公用 事业 单位 会 越 早 参与 这 一 项 目 ， 而 且 他 
们 的 客户 也 会 更 积极 地 响应 。 而 随 着 客户 环保 意识 较 弱 的 公用 事业 单 
位 加 入 ， 家 庭 能 源 报告 的 影响 似乎 就 减 小 了 。 因 此 ， 正 如 实验 中 的 随 
机 分 组 能 确保 实验 组 和 对 照 组 是 相似 的 一 样 ， 随 机 选择 研究 地 点 也 能 
确保 研究 结论 可 以 从 一 组 参与 者 泛 化 至 更 普遍 的 总 体 〈 回 想 一 下 第 3 章 
有 关 抽 样 的 内 容 ) 。 也 就 是 说 ， 如 果 研 究 地 点 不 是 随机 抽取 的 ， 那 么 
即便 是 一 个 设计 和 实施 都 很 完美 的 实验 所 得 出 的 结论 ， 在 其 泛 化 阶段 
也 会 遇 到 问题 。 


! 上 个 月 的 邻里 比较 上 个 月 ， 你 的 用 电量 比 其 他 高 效 的 
! 邻居 要 少 15%。 I 
1 你 的 效率 等 级 | 
1 尔 a Hs 1 
7 fi 504 千瓦 时 > Exe BOO ! 
! 高 效 的 邻居 596 千瓦 时 高 @ | 
A AR fe 1992 低 于 平均 等 级 | ! 
| 所 有 邻居 千瓦 时 | 
| 千瓦 时 : — 100 瓦 的 电灯 泡 连 续 亮 10 个 小 时 则 消耗 1 千瓦 时 ， 即 1 度 电 。! 


邻里 比较 模块 


行动 方案 : 根据 你 的 用 电 情 况 和 房屋 概况 为 您 选择 的 个 性 化 方案 


速效 对 策 
立刻 就 能 做 的 事情 


调整 电视 的 显示 设置 

新 电视 起 初 是 为 了 让 其 在 展厅 
呈现 最 佳 的 观看 效果 而 设置 的 ， 
但 家 用 电视 通常 不 需要 这 样 的 
设置 。 

调整 电视 的 显示 设置 最 高 能 降低 
50% 的 耗 电量 ,而 且 也 不 会 影 
啊 画 面 质量 。 利 用 电视 上 的 “ 显 
示 ” 或 “图 片 ”菜单 ， 调 整 “对 
比 度 ” 和 “亮度 ”对 能 耗 的 影响 
最 大 。 

调 暗 显 示 需 还 能 延长 电视 的 使 用 


巧妙 购置 
花 小 钱 省 大 钱 


安装 感应 开关 

总 是 记 不 住 关 灯 ? 感应 开 
关 能 在 你 离开 房间 后 自动 
将 灯 关 掉 ， 省 心 又 省 钱 。 
感应 开关 对 频 蚂 有 人 进出 
的 房间 (例如 我 们 的 家 ) 
和 没有 光线 的 地 方 〈 例如 
储 物 区 域 ) 来 说 是 理想 
之 选 。 

只 需 将 标准 的 照明 开关 换 
成 壁挂 式 感 应 开关 即 可 ， 
后 者 在 大 多 数 五 金 店 都 能 
买 到 。 


每 年 最 高 能 省 30 美元 
行动 方案 模块 


超 棒 投资 
省 大 钱 的 大 决定 


买 一 个 新 洗衣 机 

用 洗衣 机 洗衣 服 耗 电量 
很 大 ,尤其 是 用 温水 或 
热 水 洗 。 

事实 上 ， 当 用 温水 或 热 
水 洗 时 ，90% 的 能 源 
消耗 都 是 给 水 加 热 所 产 
生 的 。 

一 些 节 能 洗衣 机 的 用 水 
量 仅 是 老式 洗衣 机 的 一 
半 ， 这 就 意味 着 它 能 帮 
你 省 钱 。 


图 4.6 家 庭 能 源 报告 包括 一 个 邻里 比较 模块 和 一 个 行动 方案 模块 。 经 爱 思 唯 尔 
(Elsevier) 授权 复制 自 Allcott (2011) ， 图 1 和 图 2。 


图 4.7 111 个 测试 家 庭 能 源 报告 对 用 电量 影响 的 实验 结果 。 在 后 来 加 入 该 项 目的 地 
方 ， 家 庭 能 源 报告 对 用 电量 的 影响 往往 较 小 。 阿 尔 科 特 认 为 ， 这 一 现象 主要 是 因为 
用 户 环保 意识 越 强 的 地 方 会 越 早 加 入 这 一 项 目 。 改 编 自 Allcott (2015) ， 图 3。 


上 述 111 个 实验 共 涉 及 来 目 美 国 各 地 约 850 万 户 家 庭 。 这 些 实验 均 
表明 ， 家 许 能 源 报 告 能 够 降低 平均 用 电量 ， 这 与 等 尔 菊 和 同事 最 初 从 
加 利 福 尼 亚 州 300 户 家 庭 那里 得 出 的 结论 是 一 样 的 。 除 此 以 外 ， 这 些 后 
续 的 实验 还 表明 ， 家 性 能 源 报告 对 用 电量 的 影响 力 因 地 点 而 寞 。 同 
时 ， 这 些 实验 也 说 明了 有 关 半 数字 实地 实验 的 两 个 更 普通 的 观点 。 首 
先 ， 当 开展 实验 的 成 本 较 低 时 ， 研 究 人 员 就 能 通过 实证 来 解决 外 部 效 
度 相关 的 问题 了 。 如 果 已 经 有 一 个 不 间断 运行 的 数据 系统 正在 对 实验 
结果 进行 测量 的 话 ， 那 么 就 满足 了 这 一 条 件 。 因 此 ， 研 究 人 员 应 该 留 
意 那 些 已 经 在 被 记录 的 有 趣 且 重要 的 行为 ， 然 后 在 现 有 的 测量 基础 设 
施 上 设计 实验 。 其 次 ， 这 些 实验 提醒 我 们 ， 数 字 实 地 实验 并 非 只 能 在 
线 进行 ， 我 认为 它们 会 越 来 越 普及 ， 许 多 结果 都 能 通过 建筑 环境 中 的 
传感器 来 测量 。 


统计 结论 效 度 、 扩 部 效 度 、 构 念 效 度 和 外 部 效 度 这 4 种 效 度 为 研 完 
人 员 所 供 了 一 个 思考 依据 ， 有 助 于 他 们 评定 茶 一 特定 实验 的 结果 是 否 
能 够 证 明 一 个 更 为 普通 的 结论 。 相 比 于 模拟 时 代 的 实验 ， 数 字 时 代 的 
实验 应 该 更 易于 通过 实证 来 解决 外 部 效 度 的 问题 ， 同 时 也 更 易于 确保 
内 部 效 度 ， 而 构 念 效 度 的 问题 则 可 能 变 得 更 具 挑 战 性 ， 尤 其 是 在 那些 
和 企业 合作 的 数字 实地 实验 中 。 


4.4.2 处 理 效应 的 异 质 性 


实验 通常 测量 的 是 平均 效应 ， 但 它 对 每 个 人 产生 的 效应 很 可 能 是 
不 一 样 的 。 


超越 简单 实验 的 第 二 个 关键 概念 是 处 理 效应 的 腊 质 性 。 舒 尔 次 等 
人 的 实验 有 力 地 说 明了 同样 的 处 理 对 不 同类 型 的 人 会 产生 不 同 的 效应 
(84.4) 。 但 在 大 多 数 模拟 实验 中 ， 研 究 人 员 关 注 的 是 平均 处 理 效 
应 ， 因 为 实验 只 有 少量 参与 者 ， 而 且 研究 人 员 对 他 们 也 知之 甚 少 。 而 


在 数字 实验 中 ， 通 常会 有 更 多 的 参与 者 ， 且 研究 人 员 对 他 们 的 了 解 也 
更 多 。 在 这 样 一 个 不 同 的 数据 环境 中 ， 继 续 只 关注 平均 处 理 效应 的 研 
完 人 员 就 会 错失 三 方面 的 信息 : 一 个 处 理 是 如 何 起 作用 的 、 如 何 对 其 
进行 改进 以 及 如 何 才能 让 最 有 可 能 受益 的 人 接受 处 理 。 因 为 这 是 要 靠 
评估 处 理 效 应 的 异 质 性 才能 获得 的 信息 。 


以 下 两 个 针对 家 姓 能 源 报告 的 额外 研究 可 以 被 看 作 处 理 效 应 腊 质 
性 的 两 个 示例 。 在 其 中 一 项 研究 中 ， 阿 尔 科 特 按照 实施 处 理 前 的 用 电 
量 将 60 万 户 家 性 进一步 划分 为 10 个 等 级 ， 然 后 分 别 评估 了 家 姓 能 源 报 
告 对 它们 的 影响 。 舒 尔 次 等 人 及 现 了 家 性 能 源 报告 对 高 用 电量 居民 和 
低 用 电量 居民 的 影响 存在 着 差异 ， 而 阿尔 科 特 则 发 现 ， 单 束 蜗 用 电量 
居民 或 低 用 电量 大 民 来 说 ， 其 内 部 对 家 性 能 源 报告 的 反应 也 存在 着 天 
异 。 例 如 ， 用 电量 最 高 的 居民 〈 即 10 个 等 级 中 最 徘 上 的 居民 〉 市 约 的 
电量 是 用 电量 居中 (就 所 有 高 用 电量 大 民 来 说 〉 的 居民 的 两 倍 〈 图 
4.8) 。 此 外 ， 阿 尔 科 特 在 这 一 研究 中 还 发 现 ， 并 不 存在 “ 飞 去 来 器 效 
应 ”， 即 使 在 用 电量 最 低 的 居民 中 也 没 出 现 这 一 效应 〈 图 4.8) 。 


图 4.8 阿尔 科 特 的 研究 中 呈现 出 的 处 理 效应 的 异 质 性 。 不 同等 级 的 用 户 节 约 的 电量 
也 不 同 。 改 编 自 A1lcott (2011) ， 图 8。 

在 另 一 项 研究 中 ， 科 斯 塔 (Costa) 和 卡 恩 (Kahn) 猜测 ， 家 庭 能 
源 报告 的 有 效 性 可 能 会 因 参 与 者 的 政治 意识 形态 不 同 而 有 所 差异 ， 某 
些 意识 形态 的 参与 者 的 用 电量 可 能 还 会 因 这 一 处 理 而 增加 。 换 句 话 
说 ， 他 们 猜测 家 性 能 源 报告 对 菏 些 类 型 的 人 可 能 会 产生 “ 飞 去 来 旨 效 
应 ”。 为 了 验证 他 们 的 猜测 ， 科 斯 塔 和 卡 恩 将 欧 电 公司 的 数据 与 从 一 
个 第 三 方 的 数据 整合 者 那里 购买 的 数据 进行 了 整合 ， 其 中 后 者 的 数据 
包括 政党 登记 、 给 环境 组 织 的 捐赠 以 及 可 再 生 能 源 在 家 性 生活 中 的 使 
用 等 方面 的 信息 。 通 过 整合 后 的 数据 集 ， 科 斯 塔 和 卡 因 发现 ， 家 性 能 
源 报告 对 政治 意识 形态 不 同 的 参与 者 所 产生 的 影响 大 致 是 相似 的 ， 而 
且 各 组 均 未 表现 出 “ 飞 去 来 器 效应 ”的 迹象 〈 图 4.9) 。 


不 同 政治 意识 形态 组 的 处 理 效应 

支持 保守 党 

未 使 用 可 再 生 能 源 
未 回环 境 组 织 捐 赠 
邻居 也 支持 保守 党 


整个 样本 的 平均 处 理 效应 


SFA A te 

使 用 可 再 生 能 源 
回环 境 组 织 捐赠 

领导 也 文 持 目 由 筑 


0.06 0.04 0.02 0.00 
平均 处 理 效 应 


图 4.9 科斯 堆 和 卡 因 的 研究 中 呈现 出 来 的 处 理 效应 的 异 质 性 。 科 斯 塔 和 卡 因 对 整个 
ad nn un ma em 

息 与 家 庭 信 息 合 并 后 ， 他 们 利用 一 系列 统计 模型 评估 了 对 特定 群 组 的 处 理 效 应 。 
每 个 群 组 都 有 两 个 估 值 因为 这 些 估 值 取决 于 他 们 统计 模型 中 所 包含 的 协 变量 。 正 
如 该 实验 所 示 ， 处 理 效应 可 能 会 国人 而 异 ， 而 利用 统计 模型 得 出 的 处 理 效 应 的 估 值 
也 取决 于 这 些 模型 的 细节 (Grimmer, Messing, and Westwood 2014) 。 改 编 自 
Costa and Kahn (2013) ， 表 3 和 表 4。 


正如 这 两 个 研究 所 示 ， 数 字 时 代 让 我 们 实现 了 从 评估 平均 处 理 效 


应 到 评估 处 理 效应 的 寞 质 性 的 过 渡 ， 因 为 我 们 能 拥有 更 多 的 参与 者 ， 
而 且 对 他 们 有 更 多 的 了 解 。 了 解 处 理 效应 的 异 质 性 能 让 研究 人 员 为 某 


一 处 理 找到 最 有 效 的 对 象 ， 能 提供 促进 新 理论 及 展 的 事实 ， 还 能 为 可 
能 的 原理 提供 线索 ， 我 接 下 来 就 将 介绍 原理 。 


4.4.3 原理 


实验 测量 发 生 了 什么 ， 原 理 则 解释 这 是 为 什么 以 及 如 何 发 生 的 。 


超越 简单 实验 的 第 三 个 关键 概念 是 原理 。 原 理 能 告诉 我 们 一 个 处 
理 为 什么 能 产生 影响 或 如 何 产生 影响 。 弄 清楚 原理 的 过 程 有 时 也 被 称 
作 寻 找 中 介 变 量 。 尽 管 通过 实验 可 以 很 好 地 评估 因果 效应 ， 但 实验 设 
计 的 初衷 往往 并 不 是 为 了 揭示 原理 。 数 字 实 验 能 以 两 种 方式 帮助 我 们 
找 出 原理 : (1) 使 我 们 能 够 搜集 更 多 的 过 程 数据 ，《〈2) 使 我 们 能 够 
测试 许多 相关 的 处 理 。 


因为 很 难 正式 定义 原理 (Hedstróm and Ylikoski 2010) ， 所 以 
我 将 先 从 一 个 简单 的 示例 开始 ， 即 青 标 和 维生素 C 缺 乏 病 的 关系 
(Gerber and Green 2012) 。 在 18 世 纪 ， 医 生 普 遍 都 知道 ， 如 果 水 手 
们 吃 青 柠 的 话 ， 他 们 就 不 会 得 维生素 C 缺 乏 病 。 维 生 素 C 缺 乏 病 是 一 种 
可 怕 的 疾病 ， 所 以 这 是 一 个 非常 有 用 的 信息 。 但 医生 并 不 知道 青森 为 
什么 能 够 预防 它 。 直 到 将 近 200 年 后 的 1932 年 ， 科 学 家 才 证 明了 青 柠 之 
所 以 能 预防 该 病 是 因为 含有 维生素 C (Carpenter 1988) 。 也 就 是 说 ， 
在 该 示例 中 ， 维 生 素 C 就 是 青 柠 能 预防 这 种 病 的 原理 (图 4. 10) 。 找 出 
原理 具有 很 重要 的 科学 意义 ， 许 多 科学 都 是 关于 理解 事情 为 什么 会 发 
生 的 。 它 同时 也 具有 很 重要 的 实践 意义 ， 一 旦 我 们 理解 了 一 个 处 理 起 
作用 的 原理 ， 就 有 可 能 开发 出 效果 更 好 的 新 处 理 方案 。 


没有 原理 的 因果 效应 有 原理 的 因果 效应 
图 4.10 青 柠 能 够 预防 维生素 C 缺 乏 病 ， 其 原理 是 它 含有 丰富 的 维生素 0。 

不 垃 的 是 ， 找 出 原理 是 非常 困难 的 。 不 同 于 青 柠 和 维生素 C 缺 乏 
病 ， 在 许多 社会 情境 中 ， 处 理 很 可 能 是 通过 多 个 相互 关联 的 途径 产生 
影响 的 。 但 在 前 面 所 描述 的 有 关 社 会 规范 和 用 电量 的 研究 中 ， 研 究 人 
员 就 试图 通过 搜集 过 程 数据 并 测试 相关 人 处理 来 找 出 原理 。 


找 出 可 能 原理 的 一 种 方法 是 搜集 某 一 处 理 如 何 影响 可 能 原理 的 过 
程 数 据 。 例 如 ， 阿 尔 科 特 甸 指出 ， 家 性能 源 报告 能 够 让 人 们 减少 用 电 
量 。 但 这 些 报告 是 如 何 减少 用 电量 的 呢 ? 原理 是 什么 呢 ? 在 一 项 后 续 
研究 中 ， 阿 尔 科 特 和 罗杰斯 与 一 家 电力 公司 进行 了 合作 。 该 电力 公司 
通过 一 项 回赠 活动 了 解 了 有 哪些 用 户 将 其 家 用 电器 升级 为 更 市 能 的 产 
品 。 通 过 这 些 信息 ， 阿 尔 科 特 和 罗杰斯 发 现 ， 收 到 家 庭 能 源 报告 且 升 
级 了 家 电 的 家 性 数量 仅 比 未 收 到 报告 却 也 升级 了 家 电 的 家 性 数量 稍微 
多 一 些 ， 因 此 升级 家 电 有 所 市 约 的 电量 仪 占 收 到 报告 的 家 性 所 市 约 的 总 
电量 的 2%。 换 句 话 说 ， 升 级 家 电 并 不 是 家 性 能 源 报告 降低 用 电量 的 主 
要 原理 。 


找 出 原理 的 第 二 种 方法 是 在 实验 中 设置 彼此 稍 有 不 同 的 处 理 。 例 
如 ， 在 和 舒 尔 欧 等 人 的 实验 以 及 后 续 所 有 关于 家 许 能 源 报 告 的 实验 中 ， 
参与 者 收 到 的 家 庭 能 源 报告 〈 即 实验 处 理 ) 主要 包括 两 部 分 : (1) 市 
能 建议 ，(2) 其 与 邻居 的 用 电量 对 比 信 息 〈 图 4.6〉 。 因 此 ， 引 起 变 


化 的 原因 可 能 是 节能 建议 ， 而 不 是 与 邻居 的 对 比 信息 。 为 了 验证 这 一 
可 能 性 ， 费 拉 罗 (Ferraro) 、 米 兰 达 (Miranda) MEET (Price) 
与 佐治 亚 州 亚特兰大 附近 的 一 家 水 务 公 司 合作 开展 了 一 项 有 关节 约 用 
水 的 实验 。 该 实验 涉及 了 约 100000 户 家 庭 ， 他 们 将 这 些 家 庭 分 成 了 以 
下 4 组 : 


。 收 到 节 水 建议 的 一 组 : 
。 收 到 节 水 建议 以 及 一 条 呼吁 节 水 的 倡议 的 一 组 ; 


。 收 到 节 水 建议 、 一 条 呼吁 节 水 的 倡议 以 及 其 与 邻居 在 用 水 量 方 
面 的 对 比 信息 的 一 组 ; 


。 未 收 到 任何 信息 的 对 照 组 。 


研究 人 员 发 现 ， 只 有 市 水 建议 的 处 理 在 短期 (一 年 ) 、 中 期 〈 两 
FE) 和 长 期 (三 年 ) 内 对 参与 者 的 用 水 量 都 没有 影响 ， 节 水 建议 外 加 
节 水 倡议 的 处 理 能 让 参与 者 减少 用 水 量 ， 但 仅 限 于 短期 内 ; 市 水 建 
议 、 节 水 倡议 以 及 邻里 对 比 信 息 的 处 理 则 在 短期 、 中 期 和 长 期 内 都 能 
让 参与 者 减少 用 水 量 〈 图 4. 11) 。 采 取 分 类 处 理 的 这 类 实验 是 找 出 处 
理 的 哪 一 部 分 或 哪些 部 分 是 造成 影响 的 原因 的 一 种 好 方法 (Gerber 
and Green 2012, section 10.6) 。 例 如 ， 费 拉 罗 和 同事 的 实验 就 表 
明了 只 有 市 水 建议 是 不 能 让 参与 者 减少 用 水 量 的 。 


理想 的 情况 是 ， 我 们 能 从 上 述 类 型 的 处 理 分 层 设计 上 升 到 完全 析 
因 设计 ， 有 时 也 称 为 兴 析 因 设 计 。 在 该 设计 中 ， 研 究 人 员 会 对 三 个 因 
素 所 有 可 能 的 组 合 都 进行 测试 Ra. 1) ， 这 样 便 能 对 每 个 因素 单独 的 
效应 和 组 合 起 来 的 效应 进行 全 面 的 评估 。 例 如 ， 费 拉 罗 和 同事 的 实验 
就 没有 表明 只 有 邻里 对 比 信息 是 否 能 带 来 行为 的 长 期 改变 。 在 过 去 ， 
开展 完全 析 因 实验 是 很 困难 的 ， 因 为 需要 大 量 的 参与 者 ， 而 且 需 要 研 


究 人 员 能 够 精确 地 控制 和 实施 大 量 的 处 理 。 但 在 某 些 情形 下 ， 数 字 时 
代 消 除了 这 些 组 织 实 施 上 的 限制 。 


图 4.11 费 拉 罗 、 米 兰 达 和 普 赖 斯 的 实验 结果 。 研 究 人 员 于 2007 年 5 月 21 日 将 不 同 内 
容 的 处 理 信息 发 出 ， 然 后 分 别 于 2007 年 、2008 年 和 2009 年 的 夏天 测量 了 结果 。 通 过 
采取 不 同类 型 的 处 理 ， 研 究 人 员 和 硕 望 能 对 原理 有 更 好 的 理解 。 坚 线 代 表 的 是 研究 人 
员 估 计 的 置信 区 间 。 实 际 研究 材料 可 参见 Bernedo，Ferraro，and Price (2014) o 
改编 自 Ferraro，Miranda，and Price (2011) , #1. 


表 4.1 三 个 因素 的 完全 en 
三 个 因素 分 别 是 建议 、 倡 议和 和 邻里 信息 


处 理 
—__ 


ee ee 议 


特征 
邻里 信息 


建议 + 倡议 


建议 + 邻里 信息 
倡议 + 邻里 信息 
建议 + 倡议 + 邻里 信息 


综 上 所 述 ， 原 理 ， 即 一 项 处 理 产 生效 应 的 途径， 是 极其 重要 的 。 
数字 时 代 的 实验 有 助 于 研究 人 员 通 过 搜集 过 程 数据 和 采取 完全 析 因 设 
IRRE. 然后 研究 人 员 可 以 利用 专门 用 于 测试 原理 的 实验 ， 直 接 
验证 通过 这 些 方法 所 了 解 到 的 原理 。 


忆 的 来 说 ， 效 度 、 处 理 效应 的 异 质 性 和 原理 这 三 个 概念 为 设计 和 
评价 实验 提供 了 一 个 有 力 的 框架 。 这 些 概念 有 助 于 研究 人 员 超 越 只 针 


对 “什么 能 够 起 作用 ”的 简单 实验 ， 进 而 设计 出 与 理论 联系 更 紧密 
的 、 能 够 揭示 处 理 在 何 种 情境 下 以 及 为 什么 会 产生 效应 的 丰富 实 验 ， 
它们 甚至 能 帮助 研究 人 员 设计 出 更 有 效 的 处 理 方案 。 在 这 一 有 关 实 验 
的 概念 背景 下 ， 接 下 来 我 将 介绍 如 何 才能 开展 实验 。 


1. P 值 就 是 当 原 假设 为 真 时 所 得 到 的 样本 观察 结果 或 更 极端 的 结果 出 现 的 概率 。 一 一 
编者 注 


4.5 使 实验 成 为 现实 


即便 你 不 在 一 家 大 型 科技 公司 工作 ， 也 能 开展 数字 实验 。 你 可 以 
自行 开展 或 与 能 帮助 你 的 人 〔〈 以 及 你 能 帮助 的 人 ) 合作 开展 。 


在 这 一 点 上 ， 我 希望 大 家 对 自己 有 望 开展 数字 实验 感到 兴奋 。 如 
果 你 在 一 家 大 型 科技 公司 工作 ， 那 么 这 类 实验 对 你 来 说 可 能 已 经 是 家 
第 便 饭 了 。 但 如 果 你 不 在 一 家 科技 公司 工作 ， 可 能 融会 认为 和 目 己 无 法 
开展 这 类 实验 。 幸 运 的 是 ， 事 实 并 非 如 此 。 只 需 一 点 创造 力 和 努力 ， 
每 个 人 都 能 开展 数字 实验 。 


首先 ， 区 分 自行 开展 和 与 有 能 力 的 人 合作 开展 这 两 种 主要 方式 是 
很 有 帮助 的 。 而 且 自 行 开展 实验 也 有 几 种 不 同 的 方式 : 利用 现 有 环境 
开展 实验 、 创 建 自己 的 实验 或 是 创建 自己 的 产品 以 进行 反复 实验 。 通 
过 下 面 的 例子 你 可 以 看 出 ， 这 些 方 法 中 并 不 存在 对 所 有 情形 都 最 适用 
的 方法 ， 最 好 是 将 它们 看 作 在 成 本 、 控 制 、 真 实 和 道德 伦理 这 4 个 主要 
维度 上 各 有 利兹 的 方法 图 4. 12) 。 
成 本 ”控制 AS 。 ”道理 伦理 


利用 现 有 环境 低 低 高 ”有 可 能 很 复杂 
自行 开展 一 > 创建 自己 的 实验 pe A 中 等 相对 简单 
要 人 Nana 高 高 高 相对 简单 
吏 实 验 成 
为 现实 
ij = i Lake, 
e 低 ps 高 ”有 可 能 很 复杂 
的 人 合作 


图 4.12 各 种 开展 实验 的 方式 的 利 次 总 结 。 成 本 ， 是 指 研究 人 员 所 花费 的 时 间 和 金 
钱 。 控 制 ， 是 指 在 招募 参与 者 、 随 机 分 组 、 实 施 处 理 和 测量 结果 方面 做 你 想 做 的 事 


情 的 能 力 。 真 实 ， 是 指 实 验 环 境 与 日 常生 活 中 所 遇 到 的 情形 相 匹 配 的 程度 ; BER 
的 是 ， 高 匹配 程度 对 验证 理论 来 说 并 不 总 是 重要 的 (Falk and Heckman 2009) 。 道 
德 伦理 ， 是 指 拥 有 好 的 出 发 点 的 研究 人 员 应 对 可 能 出 现 的 道德 伦理 挑战 的 能 力 。 


4.5.1 利用 现 有 环境 开展 实验 


你 可 以 在 现 有 环境 中 开展 实验 ， 这 通常 无 须 进 行 任何 编码 或 与 别 
ARME 


MITE EGE, UE MATI Tee fF Ta xe AAA 
的 基础 上 开展 实验 。 采 取 这 一 方式 可 以 开展 相当 大 规模 的 实验 ， 且 无 
须 与 企业 合作 或 是 进行 大 量 的 软件 开发 。 


例如 ， 珍 妮 弗 。 多 里 亚 克 (Jennifer Doleac) MT +» HAA 
(Luke Stein) 束 曾 利用 一 个 类 似 于 元 雷 格 列表 网 (Craigslist) 的 
在 线 商 城 开 展 了 一 项 则 在 测量 种 族 歧 视 的 实验 。 在 实验 中 ， 他 们 为 上 
和 干 个 音乐 播放 器 做 广告 宣传 ， 然 后 通过 系统 地 改变 卖家 的 特征 研究 了 
种 族 对 经 济 交 易 的 有 影响。 此 外 ， 他 们 还 借助 实验 的 规模 评估 了 什么 时 
候 该 影响 会 更 大 《处 理 效应 的 异 质 性 ) ， 并 对 该 影响 产生 的 可 能 原因 
(原理 ) 给 予 了 一 些 解 释 。 


多 里 亚 克 和 斯 泰 因 的 音乐 播放 器 广告 主要 在 三 个 方面 存在 着 差 
异 。 首 先是 卖家 的 特征 不 同 ， 表 现在 照片 中 拿 音 乐 播放 器 的 手 的 不 同 
《肤色 是 白 的 、 黑 的 、 白 的 且 有 文身 ， 见 图 4. 13) 。 其 次 是 要 价 不 同 
(90 美 元 、110 美 元 、130 美 元 )。 最 后 是 广告 内 容 的 质量 的 不 同 (高 
质量 和 低 质 量 ， 例 如 单词 是 否 有 大 小 写 和 拼写 方面 的 错误 ) 。 因 此 ， 
广告 采用 了 3X3X2 的 设计 ， 并 被 投放 到 了 从 小 城市 (例如 印第安 纳 州 
的 科 科 莫 和 内 布 拉 斯 加 州 的 北 普 拉 特 ) 到 大 都 市 〈 例 如 纽约 和 洛 杉 
HL) 300 多 个 地 方 的 当地 市 场 中 。 


图 4.13 多 里 亚 克 和 斯 泰 因 实验 中 手 的 照片 。 为 了 衡量 在 线 商 城中 存在 的 种 族 歧 视 ， 
音乐 播放 器 分 别 由 具有 不 同 特征 的 卖家 出 售 。 经 约翰 。 威 利 父 子 出 版 公司 (John 
Wiley and Sons) 许可 复制 自 Doleac and Stein (2013) ， 图 1。 

总 的 来 说 ， 白 人 卖家 的 销售 情况 比 黑人 卖家 的 要 好 ， 有 文身 的 卖 
家 的 销售 情况 则 居中 。 例 如 ， 昌 人 卖家 的 音乐 播放 器 有 更 多 的 买 家 ， 
且 其 最 终 的 成 交 价 也 较 高 。 除 了 这 些 平均 效应 以 外 ， 多 里 亚 克 和 斯 泰 
因 还 评估 了 效应 的 异 质 性 。 例 如 ， 早 期 理论 的 一 个 预测 是 ， 在 买 家 竞 
争 越 激 烈 的 市 场 ， 攻 视 会 越 少 。 通 过 将 市 场 中 买 家 出 价 的 次 数 作为 衔 
量 买 家 竞争 程度 的 指标 ， 研 究 人 员 发 现 ， 在 买 家 竞争 程度 较 低 的 市 
场 ， 黑 人 卖家 收 到 的 出 价 确实 较 少 也 较 低 。 此 外 ， 通 过 对 比 高 质量 广 
告 和 低 质量 广告 的 播放 需 销 售 情况 ， 多 里 亚 元 和 斯 泰 因 发 现 ， 广 告 质 
量 对 黑人 腾 家 和 有 文身 的 夹 家 所 受到 的 歧视 没有 影响 。 最 后 ， 借 助 广 


告 投放 范围 包含 300 多 个 市 场 这 一 优势 ， 研 究 人 员 发 现 ， 黑 人 卖家 在 犯 
罪 率 和 居住 隔离 程度 均 偏 蜗 的 城市 受到 的 皮 视 也 会 更 多 。 这 些 结果 均 
无 法 准确 地 解释 为 什么 黑人 卖家 的 销售 情况 会 较 差 ， 但 是 ， 如 果 将 这 
些 结果 与 其 他 研究 结果 相 结 合 ， 研 究 人 员 便 能 对 不 同类 型 的 经 济 交 易 
中 种 族 皮 视 的 原因 给 出 一 些 理论 上 的 解释 了 。 


另外 一 个 表明 研究 人 员 可 以 利用 现 有 系统 开展 数字 实地 实验 的 例 
子 是 阿尔 努 。 范 德里 杰 特 和 同事 在 2014 年 针对 成 功 的 关键 的 研究 。 在 
生活 的 许多 方面 看 似 相 似 的 人 ， 其 最 终 的 发 展 结果 会 截然 不 同 。 对 
此 ， 一 个 可 能 的 解释 是 ， 一 个 人 所 具有 的 小 且 基 本 随机 的 优势 会 一 直 
伴随 着 他 并 随 着 时 间 的 推移 而 增长 ， 这 一 过 程 被 研究 人 员 称 为 优势 办 
只 。 为 了 确定 起 初 微小 的 成 功 会 一 直 存 在 还 是 会 逐渐 消失 ， 范 德里 杰 
特 和 同事 对 4 个 不 同 的 系统 进行 了 干预 ， 即 让 随机 选中 的 参与 者 获得 相 
应 的 成 功 ， 然 后 测量 这 些 随 机 分 配 的 成 功 的 后 续 影 啊 。 


更 具体 地 说 ， 他 们 对 以 下 4 个 系统 进行 了 干预 ， CO) 在 众 筹 网 站 
Kickstarter 上 ， 范 德里 杰 特 和 同事 投资 了 随机 选择 的 项 目 ， (2) 在 
产品 点 评 网 站 Epinions 上 ， 他 们 正面 评价 了 随机 选择 的 评论 ， DE 
维基 百科 上 ， 他 们 奖励 了 随机 选择 的 贡献 者 ; (4) 在 请 愿 网 站 
Change. org 上 ， 他 们 在 随机 选择 的 请 愿 书 上 签 下 了 自己 的 名 字 。 然 后 
他 们 在 4 个 系统 中 均 发 现 了 极为 相似 的 结果 : 与 原本 坚 无 区 别 的 同一 个 
系统 的 其 他 用 户 相 比 ， 在 起 始 阶段 被 随机 选中 并 获得 相应 成 功 的 参与 
者 ， 其 后 续 的 成 功 也 会 更 多 (图 4. 14) 。 许 多 系统 中 都 存在 着 这 样 的 
规律 ， 这 便 增加 了 上 述 结 果 的 外 部 效 度 ， 因 为 这 一 事实 降低 了 这 个 规 
律 只 是 某 一 特定 系统 产物 的 可 能 性 。 


平均 成 功 


0.5 1.0 0.0 0.5 
Abt fia 
Fi 处 理 情况 : 
一 实验 组 
对 照 组 


图 4.14 4 个 不 同系 统 中 随机 分 配 的 成 功 的 长 期 效应 。 (1) 在 众 筹 网 站 Kickstarter 
上 ， 范 德里 杰 特 和 同事 投资 了 随机 选择 的 项 目 ; (2) 在 产品 点 评 网 站 Epinions 上 ， 
他 们 正面 评价 了 随机 选择 的 评论 ; (3) 在 维基 百科 上 ， 他 们 奖励 了 随机 选择 的 贡献 
者 ; (4) 在 请 愿 网 站 change. org 上 ， 他 们 在 随机 选择 的 请 愿 书 上 签 下 了 自己 的 名 
Fo. 4 Avan de Rijt et al. (2014) ， 图 2。 


这 两 个 例子 表明 ， 人 研究 人 员 在 不 与 企业 合作 或 不 构建 复杂 数字 系 
统 的 情况 下 ， 也 能 开展 数字 实地 实验 。 此 外 ， 表 4.2 列 出 了 更 多 的 实 
验 ， 用 以 说 明 研 究 人 员 在 利用 现 有 系统 的 基础 设施 来 实施 处 理 、 测 量 
结果 方面 有 着 哪些 可 能 性 。 对 研究 人 员 来 襄 ， 这 些 实验 的 成 本 相对 较 
低 ， 且 较 贴 近 真 实生 活 ， 但 其 对 参与 者 、 人 处 理 和 需要 测量 的 结果 的 党 
控 程 度 有 限 。 此 外 ， 对 于 仅 通过 一 个 系统 开展 的 实验 ， 研 究 人 员 需 要 
注意 ， 实 验 的 处 理 效应 可 能 是 在 该 系统 特有 的 机 制 ( 例 如 Kickstarter 
对 项 目的 排序 方式 或 Change. org 对 请 愿 书 的 排序 方式 ， 更 多 内 容 可 参 
见 第 2 章 的 算法 干扰 ) 的 推动 下 产生 的 。 最 后 ， 当 研究 人 员 利 用 正在 运 
行 的 系统 开展 实验 时 ， 会 遇 到 一 些 赤 手 的 道德 伦理 问题 ， 有 可 能 会 对 
参与 者 、 非 参与 者 和 系统 造成 伤害 。 第 6 章 将 更 详细 地 探讨 这 些 道德 伦 


理 问题 ， 同 时 范 德 里 杰 特 的 研究 附录 对 此 也 进行 了 很 好 的 讨论 。 但 这 
些 利用 现 有 系统 开展 实验 的 权衡 取舍 并 不 适用 于 所 有 项 目 ， 因 此 正如 
我 即将 介绍 的 ， 有 些 研究 人 员 会 创建 自己 的 实验 系统 。 

24.2 在 现 有 系统 中 开展 实验 的 示例 


Restivo and van de Rijt ( 2012, 2014) ; 
谷 仓 之 星 对 人 们 编辑 维基 百科 的 贡献 的 影响 
van de Rijt et al. ( 2014 ) 
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oe PISA EN IIA Fe BY Doleac and Stein ( 2013 ) 
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爱 彼 迎 ( Airbnb ) 上 租 客 的 种 族 对 其 租金 所 
a djs ii Edelman, Luca, and Svirsky ( 2016 ) 
30 MA 
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Vaillant et al. (2015) ; van de Rijt et 
al. (2014 ) ; van de Rijt et An 2016) 


签名 对 请 愿 成 功 的 影响 


4.5.2 创建 自己 的 实验 


创建 自己 的 实验 可 能 需要 很 高 的 成 本 ， 但 能 使 你 开展 自己 想 要 的 


除了 利用 现 有 环境 开展 实验 以 外 ， 大 家 还 可 以 创建 目 己 的 实验 。 
该 方法 主要 的 优势 是 可 控 性 ， 也 就 是 说 ， 如 果 你 目 行 创建 实验 的 话 ， 
就 可 以 创建 自己 想 要 的 环境 和 处 理 。 这 些 定制 的 实验 环境 可 以 为 测试 
那些 在 自然 环境 中 无 法 测试 的 理论 创造 机 会 。 但 创建 自己 的 实验 也 有 
浆 端 ， 最 主要 的 就 是 成 本 可 能 会 很 咒 ， 而 且 你 所 创建 的 环境 可 能 无 法 
具有 自然 存在 的 系统 的 真实 性 。 此 外 ， 创 建 自己 的 实验 的 研究 人 员 还 
必须 有 招募 参与 者 的 策略 。 在 利用 现 有 系统 开展 实验 时 ， 研 究 人 员 基 
本 上 是 将 实验 通过 系统 顺便 带 给 了 参与 者 。 但 如 果 古 创建 目 己 的 实 
验 ， 研 究 人 员 则 再 要 招 礁 参与 者 参加 实验 。 羊 运 的 是 ， 像 机 器 人 MTurk 
这 样 的 服务 平台 为 研究 人 员 招 筋 实 验 参与 者 提供 了 便利 的 渠 着 。 


可 被 用 来 说 明定 制 环境 在 测试 抽象 理论 方面 优势 的 例子 是 格雷 区 
里 。 休 伯 (Gregory Huber) , HH + #/R (Seth Hill) 和 加 布 里 埃 
MR + 162% (Gabriel Lenz〉2012 年 的 数字 实验 室 实验 。 该 实验 探究 了 
民主 治理 可 能 存在 的 实际 限制 。 早 期 针对 实际 选举 的 非 实 验 性 研究 表 
明 ， 选 民 无 法 对 现任 执政 者 的 表现 进行 准确 的 评估 。 有 具体 来 说 ， 选 民 
似乎 会 因 以 下 三 个 因素 而 在 评估 时 出 现 偏差 CD 他 们 关注 的 是 现任 
执政 者 近期 而 非 一 直 以 来 的 表现 ; (2) 他 们 可 能 会 被 华而不实 的 言 
论 、 主 陷 和 营销 信息 所 操纵 ; (3) 他 们 可 能 会 被 与 现任 执政 者 政绩 无 
关 的 事件 所 影响 ， 例 如 当地 运动 队 的 获胜 或 天 气 。 但 在 这 些 早期 的 研 
究 中 ， 研 究 人 员 很 难 将 上 述 任何 一 个 因素 与 真实 复杂 的 选举 中 的 其 他 
事情 隅 离开 来 。 因 此 ， 休 伯 和 同事 创建 了 一 个 高 度 简 化 的 投票 环境 ， 
以 将 上 述 三 种 偏差 分 别 阳 离 出 来 ， 然 后 对 其 进行 实验 研究 。 


下 述 实 验 设 置 听 起 来 很 不 真实 ， 但 大 家 需要 记 住 的 是 ， 真 实 并 不 
是 实验 室 实验 的 一 个 目标 。 实 验 室 实验 的 目标 是 将 你 试图 研究 的 过 程 
明确 地 隅 离 出 来 ， 在 更 真实 的 研究 中 ， 这 一 目标 有 时 反倒 难以 实现 了 
(Falk and Heckman 2009) 。 此 外 ， 在 休 伯 和 同事 的 研究 中 ， 他 们 认 
为 ， 如 果 选 民 在 其 创建 的 高 度 简 化 的 环境 中 无 法 有 效 评估 执政 者 的 政 
绩 ， 那 么 他 们 在 更 真实 、 更 复杂 的 环境 中 就 更 没 办 法 有 效 评 估 了 。 
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个 参与 者 会 被 告知 他 有 一 个 分 配器 ， 该 分 配器 会 在 每 轮 游 戏 中 免费 给 
他 发 放 代 币 ， 并 告诉 他 有 的 分 配器 发 放 的 代 币 要 多 于 其 他 分 配器 。 此 
外 ， 每 个 参与 者 还 会 被 告知 ， 在 16 轮 游戏 后 ， 他 将 有 机 会 选择 是 继续 
保留 现 有 的 分 配 右 还 是 要 求 重新 分 配 一 个 分 配器 。 和 鉴于 大 家 已 经 7 了解 
了 体 伯 和 同事 的 研究 目标 ， 所 以 你 们 应 该 明白 了 ， 这 里 的 分 配器 代表 
的 就 是 一 个 政府 ，16 轮 游戏 后 的 选择 代表 的 就 是 选举 ， 但 参与 者 并 未 
意识 到 研究 的 目标 。 体 们 和 同事 共 招 对 了 约 4000 名 参与 者 ， 每 名 参与 
者 在 完成 这 项 大 约 需 8 分 钟 的 任务 后 会 获得 1. 2558 70 


正如 前 面 提 到 的 ， 早 期 研究 的 一 个 发 现 是 ， 选 民 会 因 执政 者 完全 
无 法 掌控 的 事情 ， 例 如 当地 运动 队 的 胜利 或 天 气 ， 对 其 政绩 做 出 过 高 
或 过 低 的 评估 。 为 了 评估 参与 者 的 选择 是 否 会 受到 其 所 在 环境 中 完全 
随机 的 事件 的 影响 ， 休 伯 和 同事 在 实验 中 增加 了 抽奖 环节 ， 即 在 第 8 轮 
或 第 16 轮 游戏 时 ， 参 与 者 会 进行 一 次 随机 抽奖 ， 其 中 有 些 人 会 局 5000 
分 ， 有 些 人 赢 0 分 ， 有 些 人 则 输 5000 分 。 休 伯 和 同事 则 在 用 这 一 抽奖 环 
节 来 模拟 那些 与 执政 者 政绩 无 关 的 好 的 或 坏 的 消息 。 尽 管 参与 者 被 明 
确 告 知 ， 抽 奖 与 他 们 的 分 配器 表现 无 天 ， 但 抽奖 结果 还 是 会 影响 参与 
者 的 选择 。 在 抽奖 中 启 了 5000 分 的 参与 者 更 有 可 能 保留 其 分 配 占 ， 而 
且 相 比 于 将 抽奖 设置 在 第 8 轮 ， 将 其 设置 在 第 16 轮 时 《刚好 在 选择 是 否 
更 换 分 配器 之 前 ) 这 一 影响 会 更 加 明显 〈 网 4.15) 。 根 据 这 些 结果 和 
其 论文 中 其 他 几 项 实验 的 结果 ， 休 伯 和 同事 得 出 结论 ， 即 便 在 简化 的 
环境 中 ， 选 民 也 难以 做 出 明智 的 决定 ， 这 一 结论 影响 了 日 后 关于 选民 
决策 的 其 他 研究 (Healy and Malhotra 2013) 。 休 伯 和 同事 的 实验 表 
明 ， 机 器 人 MTurk 可 被 用 来 为 间 在 准确 测试 非常 具体 的 理论 的 实验 室 实 
验 招 筋 参与 者 。 这 个 实验 同时 也 说 明了 创建 自己 的 实验 环境 的 价值 : 
很 难 想象 在 其 他 环境 中 如 何 将 这 些 因 素 如 此 明确 地 隔离 出 来 。 


图 4.15 休 伯 、 斋 尔 和 伦 效 的 实验 结果 。 在 抽奖 中 赢 了 5000 分 的 参与 者 更 有 可 能 保留 
其 分 配器 ， 而 且 相 比 于 将 抽奖 设置 在 第 8 轮 ， 将 其 设置 在 第 16 轮 时 这 一 影响 会 更 加 明 
Zo. 74 AB Huber, Hill, and Lenz (2012) ， 图 5。 


除了 创建 类 似 实验 室 的 实验 环境 ， 研 究 人 员 还 能 创建 更 贴近 现实 
的 实验 环境 。 例 如 ， 森 托 拉 《〈Centola) 就 构建 了 一 个 数字 实地 环境 ， 
以 研究 社交 网 络 结构 对 行为 传播 的 影响 。 他 研究 的 问题 需要 他 观察 同 
一 行为 在 多 个 群体 内 (这 些 群 体 仪 在 社交 网 络 结构 方面 存在 着 差异 ， 
其 他 方面 基本 一 至 的 传播 。 要 想 做 到 这 一 点 ， 唯 一 的 方法 就 是 创建 
一 个 定制 实验 。 在 这 种 情况 下 ， 和 森 托 拉 创 建 了 一 个 基于 网 络 的 健康 社 
区 。 


和 森 托 拉 在 健康 网 站 上 发 布 广告 ， 招 驭 了 约 1500 名 参与 者 。 当 参与 
者 进入 被 称 为 “健康 生活 方式 网 ”的 在 线 社区 时 ， 他 们 需 签署 知情 同 
意 书 ， 然 后 森 托 拉 会 为 其 分 配 “ 健 康 伙伴 ”。 森 托 拉 分 配 健康 伙伴 的 
方式 使 他 能 够 在 不 同 群 组 内 构建 不 同 的 社交 网 络 结构 : 有 些 群 组 是 随 
机 网 络 ( 即 每 个 人 被 选 为 健康 伙伴 的 概率 是 一 样 的 ) ， 其 他 群 组 则 是 
集群 网 络 〈 即 有 些 人 被 选 为 健康 伙伴 的 概率 要 大 一 些 ) 。 然 后 ， 森 托 
拉 在 每 个 网 络 中 引入 了 一 种 新 的 行为 : 注册 一 个 拥有 额外 健康 信息 的 
新 网 站 的 机 会 。 每 当 有 人 注册 这 个 新 网 站 时 ， 他 所 有 的 健康 伙伴 都 会 
收 到 关于 他 注册 行为 的 一 封 电子 邮件 。 森 托 拉 发 现 ， 相 比 于 随机 网 
络 ， 注 册 新 网 站 的 行为 在 集群 网 络 中 传播 得 更 远 、 更 快 。 这 一 发 现 与 
现 有 的 一 些 理论 相悖 。 


总 的 来 说 ， 创 建 自 己 的 实验 能 让 你 有 更 多 的 掌控 力 ， 能 让 你 构建 
出 最 有 利于 隔离 研究 对 象 的 环境 。 我 很 难 想象 上 述 两 个 实验 在 现 有 的 
环境 中 该 如 何 开 展 。 此 外 ， 创 建 上 自己 的 系统 还 能 减少 利用 现 有 环境 开 
展 实 验 所 面临 的 道德 伦理 问题 。 但 创建 自己 的 实验 也 会 遇 到 实验 室 实 
验 所 面临 的 许多 问题 ， 比 如 招 努 参与 者 和 对 真实 性 的 担心 。 尽 管 实 验 
可 以 在 相对 简单 的 环境 中 进行 “例如 体 们 、 和 而 尔 和 伦 效 针对 选举 的 研 
FE) ， 也 可 以 在 相对 复杂 的 环境 中 进行 《例如 森 托 拉 针 对 网 络 和 传播 


的 研究 ) ， 但 创建 目 己 的 实验 还 有 最 后 一 个 缺点 ， 那 就 是 可 能 会 既 费 
钱 又 费时 。 


4.5.3 创建 目 己 的 产品 


创建 自己 的 产品 是 一 种 高 风险 、 高 回报 的 方法 。 但 如 果 成 功 了 ， 
就 能 带 来 正 反馈 循环 ， 使 你 能 够 开展 与 众 不同 的 研究 。 


有 些 研究 人 员 会 在 创建 自己 的 实验 这 一 方法 上 更 进一步 ， 进 而 创 
建 自 己 的 产品 。 这 些 产 品 会 吸引 用 户 ， 然 后 便 成 了 开展 实验 和 其 他 类 
型 研究 的 平台 。 例 如 ， 明 尼 办 达 大 学 的 一 组 研究 人 员 就 创建 了 
MovieLens 〈 意 为 “电影 镜头 ”) ， 一 个 免费 的 、 非 商业 性 质 的 、 个 性 
化 的 电影 推荐 网 站 。 自 1997 年 以 来 ，MovieLens 一 直 在 运营 ， 在 此 期 
间 ， 网 站 搜集 了 25 万 名 注册 用 户 针对 3 万 多 部 电影 的 2000 多 万 条 评分 数 
据 (Harper and Konstan 2015) 。 研 究 人 员 利 用 MovieLens 的 活跃 用 
户 群 体 开 展 了 一 系列 精彩 的 研究 ， 从 测试 有 关公 共产 品 捐款 的 社会 科 
学 理论 到 处 理 推荐 系统 所 面临 的 算法 挑战 。《〈 有 关 这 些 研究 的 全 面 性 
的 回顾 ， 可 参阅 Harpefr and Konstan 2015) 。 如 果 研 究 人 员 没 有 这 样 
一 个 他 们 能 够 完全 掌控 的 实际 运行 的 产品 ， 那 么 这 些 实验 中 的 许多 实 
验 都 将 无 法 开展 。 


不 幸 的 是 ， 创 建 目 己 的 产品 是 非常 困难 的 ， 这 就 像 是 在 创办 一 家 
公司 一 样 : 高 风险 、 高 回报 。 如 果 成 功 了 ， 就 对 实验 的 擎 控 力 来 说 ， 
利用 这 一 方法 所 开展 的 实验 和 创建 目 己 的 实验 基本 是 一 样 的 ， 就 真实 
性 和 招募 参与 者 来 说 ， 利 用 这 一 方法 开展 实验 和 利用 现 有 环境 开展 实 
验 是 一 样 的 。 此 外 ， 这 一 方法 可 能 会 带 来 正 反 馈 循环 ， 即 更 多 的 研究 
会 让 产品 变 得 更 好 ， 更 好 的 产品 会 吸引 更 多 的 用 户 ， 有 了 更 多 的 用 户 
便 可 以 开展 更 多 的 研究 ， 以 此 类 推 (图 4. 16) 。 换 句 话 说， 一 旦 正 反 
饥 循 环 开 始 了 ， 研 究 就 会 变 得 越 来 越 容 易 。 尽 管 这 个 方法 目前 来 说 非 


常 困 难 ， 但 我 希望 随 着 技术 的 改进 ， 它 将 变 得 更 加 实用 。 然 而 在 那 之 
前 ， 如 果 研 究 人 员 想 要 利用 一 个 产品 ， 更 直接 的 策略 是 与 一 个 公司 合 
作 ， 这 也 是 我 接 下 来 要 讲 的 话题 。 


图 4.16 如 果 你 能 成 功 创建 自己 的 产品 ， 便 能 受益 于 正 反 馈 循 环 : 研究 能 让 产品 变 得 
更 好 ， 这 样 便 能 吸引 更 多 的 用 户 ， 有 了 更 多 的 用 户 便 能 开展 更 多 的 研究 。 这 类 型 的 
正 有 反馈 循环 是 非常 难 实现 的 ， 但 它 能 让 研究 人 员 开 展 之 前 不 可 能 的 实验 。MovieLens 
就 是 一 个 成 功 创造 了 正 反 馈 循 环 的 研究 事例 (Harper and Konstan 2015) 。 


4.5.4 与 有 能 力 的 组 织 合作 


合作 可 以 降低 成 本 、 扩 大 规模 ， 但 也 可 能 会 改变 你 所 能 使 用 的 参 
与 者 、 处 理 和 结 


除了 上 自己 做 ， 还 有 一 种 方法 是 与 一 个 有 能 力 的 组 织 合 作 ， 例 如 企 
业 、 政 府 或 非 政府 组 织 。 这 样 做 的 优点 是 这 些 组 织 能 让 你 开展 那些 你 
目 己 无 法 开展 的 实验 。 例 如 ， 后 文 有 一 个 实验 共有 6100 万 名 参与 者 ， 
这 是 任何 一 个 研究 人 员 都 无 法 单独 实现 的 规模 。 合 作 能 让 你 开展 之 前 
不 可 能 开展 的 实验 ， 但 同时 也 会 限制 你 。 例 如 ， 大 多 数 公 司 都 不 会 允 
许 你 开展 可 能 有 损 他 们 生意 或 声誉 的 实验 。 合 作 还 意味 着 在 你 发 表 研 
完 论 文 时 ， 可 能 会 被 要 求 “ 重 新 调整 ”研究 结 末 ， 而 且 如 末 你 的 论文 
不 利于 他 们 的 话 ， 有 些 合作 者 甚至 可 能 竭力 阻止 你 发 表 论 文 。 最 后 ， 
合作 还 意味 着 需要 成 本 去 发 展 并 维护 这 些 合 作 关 系 。 


与 有 能 力 的 组 织 建立 合作 关系 需 解决 的 核心 挑战 是 找到 一 个 平衡 
双方 利益 的 方法 ， 巴 斯 德 象 限 是 对 此 有 帮助 的 一 个 方法 (Stokes 
1997) 。 许 多 研究 人 员 认 为 ， 如 果 他 们 研究 的 是 某 个 组 织 可 能 感 兴趣 
的 东西 ， 那 么 他 们 就 不 是 在 做 真正 的 科学 研究 。 这 种 心态 会 让 成 功 建 
立 合 作 关 系 变 得 非常 困难 ， 而 且 这 也 是 完全 错误 的 。 生 物 学 家 路 易 。 
巴 斯 德 (Louis Pasteur) 的 这 项 开创 性 的 研究 可 以 完美 诠释 该 思维 方 


式 的 问题 所 在 。 当 时 巴 斯 德 被 一 家 酒精 制造 三 邀请 去 研究 将 甜 灯 汁 转 
化 为 酒精 的 发 酵 过 程 ， 在 此 期 间 ， 他 发 现 了 一 种 新 型 微生物 ， 并 由 此 
最 终 提出 了 疾病 细菌 学 说 。 新 型 微生物 的 发 现 解 决 了 一 个 非常 实际 的 
问题 ， 既 帮助 改善 了 有 酵 过 程 ， 同 时 又 促使 科学 癌 前 迈 了 一 大 步 。 因 
此 ， 与 其 认为 有 实际 用 途 的 研究 与 真正 的 科学 研究 存在 冲突 ， 不 如 将 
它们 看 作 两 个 独立 的 维度 。 研 究 的 出 发 点 可 以 是 《或 不 是 ) 实用 的 ， 
也 可 以 是 (或 不 是 ) 寻求 基本 的 认识 。 重 要 的 是 ， 有 些 研究 ， 就 比如 
巴 斯 德 的 研究 ， 既 是 为 了 解决 实际 问题 也 是 为 了 寻求 基本 认识 (图 
4.17) 。 属 于 巴 斯 德 象限 中 的 研究 ， 即 本 里 就 具有 两 个 目标 的 研究 ， 
是 研究 人 员 和 各 组 织 合 作 的 理想 之 选 。 在 此 背景 下 ， 我 将 描述 两 种 合 
作 开展 的 实验 研究 ; 一 种 是 与 企业 合作 ， 一 种 是 与 非 政府 组 织 合作 。 


大 型 公司 ， 尤 其 是 科技 公司 ， 已 为 开展 复杂 实验 开发 了 相当 精密 
的 、 先 进 的 基础 设施 。 在 科技 行业 ， 这 类 型 实验 通常 被 称 为 A/B 测 试 ， 
因为 它们 会 比较 A、B 两 项 处 理 的 有 效 性 。 为 了 增加 广告 点 击 率 等 目 
的 ， 这 些 公司 会 利用 其 先进 的 实验 基础 设施 来 开展 A/B 测 试 ， 但 这 些 设 
施 也 可 以 被 用 来 开展 促进 科学 认识 的 研究 。 能 够 说 明 这 类 研究 可 能 性 
的 一 个 例子 是 脸谱 网 和 加 州 大 学 圣迭戈 分 校 的 研究 人 员 人 针对 不 同 信息 
对 选民 投票 紊 的 影响 而 合作 开展 的 一 项 研究 (Bond et al. 2012) 。 


图 4.17 巴 斯 德 象限 。 与 其 认为 研究 只 能 是 “基础 的 ”或 “应 用 的 ”， 不 如 将 其 看 作 
既是 (或 不 是 ) 为 了 解决 实际 问题 也 是 (或 不 是 ) 为 了 寻求 基本 认识 。 巴 斯 德 针 对 
将 甜菜 汁 转化 为 酒精 的 研究 ， 提 出 了 疾病 细菌 学 说 ， 这 就 是 一 个 既 为 解决 实际 问题 
又 为 寻求 基本 认识 的 研究 示例 。 这 类 研究 是 最 适合 与 有 能 力 的 组 织 合 作 开 展 的 研 
究 。 为 了 解决 实际 问题 而 不 是 寻求 基本 认识 的 研究 示例 是 托马斯 。 爱 迪生 (Thomas 
Edison) 的 研究 ， 为 了 寻求 基本 认识 而 不 是 解决 实际 问题 的 研究 示例 是 尼 尔 斯 。 玻 
尔 (Niels Bohr) 的 研究 。 改 编 自 Stokes (1997) , M3.5. 


2010 年 11 月 2 日 美国 国会 中 期 选举 这 天 ， 居 住 在 美国 且 年 龄 在 18 少 
及 以 上 的 6100 万 名 脸谱 网 用 户 参与 了 一 项 关于 投票 的 实验 。 这 些 用 户 
在 访问 脸谱 网 时 会 被 随机 分 配 到 三 个 组 中 ， 然 后 系统 会 根据 分 组 情况 
向 其 信息 流 顶 部 推送 不 同 的 标语 《如 果 有 的 话 ) 〈 图 4. 18) 。 


。 对 照 组 ; 


有 关 投票 的 信息 性 消息 + 一 个 可 点 击 的 “我 已 投票 ”按钮 + 一 个 


计数 器 o. 


= 


。 有 关 投 票 的 信息 性 消息 + 一 个 可 点 击 的 “我 已 投票 ”按钮 + 一 个 
计数 器 + 已 点 击 “ 我 已 投票 ”的 朋友 的 姓名 和 有 照片 〈 信 息 + 社 交 组 ) 。 


际 投票 的 直接 影响 
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图 4.18 脸谱 网 上 一 项 动员 投票 的 实验 结果 。 信 息 组 的 参与 者 实际 投票 的 概率 与 对 照 
组 的 参与 者 相同 ， 但 言 急 + 社交 组 的 参 与 者 实际 投 时 的 概率 则 EMO Eo 竖 线 代表 
估算 的 95% 的 置信 区 间 。 该 图 中 的 结果 来 自 与 实际 投票 记录 进行 匹配 的 约 600 万 名 参 
与 者 。 改 编 自 Bond et al. (2012) , Al. 


AE (Bond) 和 同事 主要 研究 了 两 个 结果 : 报告 的 投票 行为 和 实 
际 的 投票 行为 。 首 先 ， 他 们 发 现 ， 信 息 + 社 交 组 的 人 点 击 “ 我 已 投票 ” 
的 概率 比 信 息 组 的 人 高 了 约 2 个 百分点 〈 约 20% : 18%) 。 其 次 ， 研 究 人 
员 将 他 们 所 搜集 的 约 600 万 名 参与 者 的 数据 与 公开 的 实际 投票 记录 对 比 
后 发 现 ， 信 息 + 社 交 组 的 人 实际 投票 的 概率 比 对 照 组 的 人 高 0. 39 个 百 分 
点 ， 而 信息 组 的 人 实际 投票 的 概率 则 与 对 照 组 的 人 相同 (图 4. 18) 。 


该 实验 的 这 些 结果 表明 ， 有 些 在 线 动员 投票 的 信息 要 比 其 他 在 线 
动员 投票 的 信息 更 有 效 ， 而 且 研究 人 员 对 该 有 效 性 的 评估 结果 还 会 不 
同 ， 这 取决 于 他 们 统计 的 是 报告 的 投票 行为 还 是 实际 的 投票 行为 。 可 
惜 的 是 ， 这 项 实验 并 没有 提供 任何 关于 社交 信息 为 什么 会 增加 投票 率 
的 信息 。 可 能 是 这 些 社交 信息 增加 了 人 们 注意 到 标语 的 可 能 性 ， 或 者 
是 增加 了 注意 到 这 一 标语 的 人 实际 投票 的 可 能 性 ， 或 者 是 两 个 原因 都 
有 。 因 此 ， 这 项 实验 提供 了 一 个 有 趣 的 发 现 ， 更 多 的 研究 人 员 可 能 会 
对 其 进行 探究 〈 参 阅 例 如 Bakshy，Eckles，et al. 2012) . 


除了 推进 研究 人 员 的 目标 以 外 ， 这 项 研究 还 推进 了 合作 组 织 ( 脸 
谱 网 ) 的 目标 。 如 果 将 研究 的 行为 由 投票 换 成 购买 肥 旺 ， 你 就 会 发 
现 ， 这 项 研究 的 结构 与 衡量 在 线 广告 效果 的 实验 结构 是 完全 相同 的 
(可 参阅 例如 Lewis and Rao 2015) 。 这 些 针对 广告 效果 的 研究 经 常 
会 衡量 接触 在 线 广 告 对 线 下 行为 的 影响 。 因 此 ， 这 项 研究 可 以 提高 脸 
谱 网 研究 在 线 广告 效果 的 能 力 ， 同 时 有 助 于 脸谱 网 让 潜在 的 广告 商 相 
信 脸 谱 网 上 的 广告 在 改变 行为 方面 是 有 效 的 。 


在 这 项 研究 中 ， 尽 管 研究 人 员 和 合作 组 织 想 要 了 解 的 东西 基本 一 
致 ， 但 也 存在 一 些 让 他 们 的 合作 陷入 紧张 氛围 的 分 区， 尤其 是 在 参与 
者 的 分 配 上 。 当 时 实验 中 对 照 组 、 信 息 组 和 信息 + 社交 组 的 人 数 分 配 是 
非常 不 均衡 的 。 对 研究 人 员 来 说 ， 这 样 不 均衡 的 分 配 从 统计 学 角度 讲 
很 低 效 ， 更 好 的 分 配方 式 是 每 组 有 1/3 的 参与 者 。 但 之 所 以 当时 采取 这 
一 分 配方 式 ， 是 因为 脸谱 网 想 让 每 个 人 都 接收 信息 + 社交 处 理 。 辛 运 的 


是 ， 研 究 人 员 说 服 脸谱 网 为 信息 组 和 对 照 组 各 保留 1% 的 参与 者 。 如 果 
没有 对 照 组 ， 衡 量 信息 + 社交 的 处 理 效应 就 基本 不 可 能 了 ， 因 为 这 将 是 
一 个 “干扰 观察 ”实验 ， 而 不 是 随机 对 照 实 验 。 这 项 研究 为 与 有 能 
的 组 织 合作 开展 实验 提供 了 宝 吐 的 实践 经 验 :， 同样 是 促成 一 项 实验 ， 
有 时 你 需要 说 服 一 个 组 织 去 实施 一 项 处 理 ， 而 有 时 则 需要 说 服 一 个 组 
织 不 去 实施 一 项 处 理 〈 即 要 求 设置 一 个 对 照 组 )。 


合作 并 不 总 是 要 找 科 技 公 司 ， 也 并 不 总 是 要 开展 有 数 百 万 参与 者 
的 A/B 测 试 。 例 如 ， 亚 历 山 大 。， 科 波 克 (Alexander Coppock) 、 安 德 
E + # if (Andrew Guess) FA iy + HOR WH KM AE C John 
Ternovski) 就 在 2016 年 与 非 政 府 环保 组 织 保育 选民 联盟 (League of 
Conservation Voters) 针对 不 同 策略 在 促进 社会 动员 方面 的 有 效 性 合 
作 开 展 了 实验 。 研 究 人 员 利 用 该 非 政 府 组 织 的 推 特 账号 发 送 了 公众 推 
文 和 直接 面向 个 人 的 、 试 图 侧重 于 不 同类 型 身份 信息 的 消 朋 ， 然 后 测 
量 了 这 些 消息 中 哪些 消息 在 动员 人 们 签署 请 愿 书 和 转发 有 关 请 愿 书 的 
内 容 方面 最 为 有 效 。 


总 的 来 资 ， 与 有 能 力 的 组 织 合作 所 能 达到 的 实验 规模 是 个 人 难以 
达到 的 ， 表 4. 3 列 出 了 研究 人 员 与 组 织 合 作 开展 的 其 他 实验 实例 。 此 
外 ， 人 合作 开 展 实验 要 比 创建 自己 的 实验 简单 很 多 。 但 合作 开展 实验 也 
存在 缺点 : 合作 会 限制 参与 者 、 处 理 及 你 所 能 研究 的 结果 的 类 型 ， 而 
且 还 可 能 引发 道德 伦理 方面 的 问题 。 发 现 合 作 实验 的 最 好 方法 是 注意 
到 那些 能 通过 有 趣 的 科学 研究 来 解决 的 实际 问题 。 如 有 果 你 还 不 习惯 
这 样 的 方式 去 观察 这 个 世界 ， 那 么 就 很 难 发 现 属于 巴 斯 德 象限 内 的 实 
验 ， 但 通过 练习 ， 你 会 变 得 越 来 越 擅 长 。 

表 4.3 研究 人 员 和 组 织 合作 开展 的 研究 实例 


Allcott ( 2011, 2015 ) ; Allcott and Rogers 
家 庭 能 源 报告 对 用 电量 的 影响 ( 2014 ) ; Costa and Kahn ( 2013 ) ; Ayres, 
Raseman, and Shih ( 2013 ) 


传播 机 制 对 传播 的 影响 Taylor, Bakshy, and Aral ( 2013 ) 


广告 中 社交 信息 的 影响 Bakshy, Eckles, et al. (2012 ) 


产品 目录 更 新 频率 对 通过 产品 目录 购买 或 
Be EEE Simester et al.( 2009 ) 
在 线 购 买 的 不 同 客户 购买 量 的 影响 
消息 内 容 对 政治 动员 的 影响 Coppock, Guess, and Ternovski( 2016 ) 


注意 : 有 些 实验 的 研究 人 员 为 合作 组 织 的 员工 。 


4.6 建议 


SS TE SE 
在 工作 中 发 现 的 特别 有 用 的 四 条 建议 ， 其 中 前 两 条 适用 于 任何 实验 ， 
后 两 条 则 主要 针对 数字 时 代 的 实验 。 


当 你 要 开展 一 项 研究 时 ， 我 的 第 一 条 建议 是 ， 在 搜集 数据 前 应 尽 
可 能 多 地 思考 。 对 习惯 于 开展 实验 的 研究 人 员 来 说 ， 这 似乎 是 显 而 易 
见 的 ， 但 对 习惯 于 利用 大 数据 资源 的 研究 人 员 来 说 ， 这 是 非常 值得 注 
意 的 《参见 第 2 蔓 ) 。 利 用 大 数据 资源 时 ， 大 多 数 工作 需要 在 搜集 到 数 
据 后 才能 完成 ， 但 开展 实验 是 相反 的 ， 大 多 数 的 工作 应 该 在 数据 采集 
有 前 完成 。 过 使 你 自己 在 搜集 数据 前 仔细 思考 的 最 好 的 方法 之 一 是 为 你 
的 研究 创建 一 个 预 分 析 计 划 ， 基 本 描述 一 下 你 将 进行 的 分 析 。 


我 的 第 二 条 适用 于 所 有 实验 的 建议 是 ， 没 有 一 个 单一 的 实验 是 完 
美的 ， 因 此 ， 你 应 该 考虑 设计 一 系列 相辅相成 的 实验 。 有 人 将 这 一 寅 
略称 为 无 敌 舰 队 策略 。 也 就 是 说 ， 与 其 努力 打造 一 条 庞 大 的 战舰 ， 不 
如 建造 许多 优势 互补 的 小 型 战舰 。 这 类 多 实验 研究 在 心理 学 领域 是 很 
常见 的 ， 在 其 他 领域 却 很 少见 。 笠 运 的 是 ， 有 些 数字 实验 的 低 成 本 使 
多 实验 研究 变 得 更 加 容易 了 。 


分 享 完 以 上 两 条 适用 于 所 有 实验 的 建议 后 ， 接 下 来 我 将 分 享 两 条 
主要 针对 数字 时 代 实 验 设计 的 建议 : 创造 零 可 变 成 本 数据 和 将 道德 伦 
理 融 入 设计 中 。 


4.6.1 创造 零 可 变 成 本 数据 


开展 大 型 实验 的 关键 是 将 你 的 可 变 成 本 降低 到 零 。 实 现 这 一 点 最 
好 的 方法 是 自动 化 和 设计 有 趣 的 实验 。 


数字 实验 可 以 有 截然 不 同 的 成 本 结构 ， 这 也 使 得 研究 人 员 能 够 开 
展 过 去 不 可 能 开展 的 实验 。 考 虑 这 一 差异 的 一 种 方式 是 从 固定 成 本 和 
ABONA CIMA A RT ARMAR) 入 手 。 固 定 成 本 是 指 不 会 随 
参与 者 数量 的 变化 而 变化 的 成 本 。 例 如 ， 在 一 项 实验 室 实验 中 ， 固 定 
成 本 可 能 束 是 租用 场地 和 购买 设备 所 产生 的 成 本 。 而 可 变 成 本 则 是 指 
会 随 参 与 者 数量 的 变化 而 变化 的 成 本 。 例 如 ， 在 一 项 实验 室 实验 中 ， 
可 变 成 本 可 能 来 自给 研究 助理 和 参与 者 的 经 济 报酬 。 一 般 来 说 ， 模 拟 
实验 是 固定 成 本 较 低 ， 可 变 成 本 较 高 ， 而 数字 实验 则 是 固定 成 本 轻 
高 ， 可 变 成 本 较 低 《〈 图 4. 19) 。 尽 管 数字 实验 的 可 变 成 本 较 低 ， 但 如 
果 你 愿意 尝试 将 其 降低 到 零 ， 就 可 以 创造 出 许多 令 人 兴奋 的 机 会 。 


模拟 实验 


成 本 


lr Zr I 
数字 实验 


gx. 上 AY. We Ei. 
参与 者 数量 


图 4.19 模拟 实验 和 数字 实验 的 成 本 结构 示意 图 。 一 般 来 说 ， 模 拟 实验 是 固定 成 本 较 
低 ， 可 变 成 本 较 高 ， 而 数字 实验 则 是 固定 成 本 较 高 ， 可 变 成 本 较 低 。 不 同 的 成 本 结 


构 意 味 着 数字 实验 能 达到 模拟 实验 不 可 能 达到 的 规模 。 


实验 的 可 变 成 本 主要 产生 于 两 个 方面 ， 即 给 研究 助理 的 经 济 报酬 
和 给 参与 者 的 经 济 报 酬 ， 我 们 可 通过 不 同 的 策略 将 这 两 方面 的 成 本 降 
低 到 零 。 给 研 完 助理 经 谤 报酬 是 因为 需要 他 们 去 招募 参与 者 、 实 施 处 
理 以 及 测量 结果 。 例 如 ， 舒 尔 欧 和 同事 针对 用 电量 的 模拟 实地 实验 就 
需要 研究 助理 前 往 每 个 家 性 实施 处 理 并 记录 电表 读数 。 这 就 意味 着 增 
加 参与 研究 的 家 几 束 会 增加 成 本 。 而 在 雷 斯 带 湛 和 范 德 里 杰 特 针对 奖 
励 与 人 们 编辑 维基 百科 页 献 的 关系 而 开展 的 数字 实地 实验 中 ， 增 加 参 
与 者 几乎 不 会 增加 任何 成 本 。 降 低 可 变 行政 成 本 的 一 般 策 略 是 用 计算 
机 便宜 的 ) RABAT (昂贵 的 ) 工作 。 粗 略 地 说 ， 你 可 以 问 目 
Ch: 当 我 的 研究 团队 中 的 每 个 人 都 在 睡 党 时 ， 这 个 实验 还 能 运转 吗 ? 
如 果 答 案 是 肯定 的 ， 那 么 你 的 实验 在 目 动 化 方面 是 很 出 众 的 。 


实验 的 可 变 成 本 还 源 于 给 参与 者 的 经 济 报酬 。 一 些 研究 人 员 会 通 
过 使 用 机 器 人 MTurk 和 其 他 在 线 劳动 力 市 场 来 减少 需 文 付 给 参与 者 的 经 
济 报酬 。 但 要 想 将 可 变 成 本 降低 到 零 ， 则 需要 采取 一 种 不 同 的 方法 。 
很 长 一 段 时 间 以 来 ， 研 究 人 员 设 计 的 实验 都 是 很 枯燥 的 ， 所 以 必须 花 
钱 才 能 让 人 参与 。 但 如 果 你 能 设计 一 个 人 们 上 自愿 想 参 与 的 实验 呢 ? 这 
上 听 起 来 可 能 有 点 令 人 难以 置信 ， 但 我 自己 就 曾 开 展 过 这 样 一 个 实验 ， 
我 将 在 后 文中 对 其 进行 描述 ， 表 4. 4 还 列 出 了 其 他 这 类 型 实验 的 例子 。 
需要 注意 的 是 ， 设 计 有 趣 的 实验 这 一 想法 与 第 3 章 中 关于 设计 更 有 趣 的 
调查 和 第 5 章 中 关于 大 规模 协作 设计 的 一 些 主题 相 呼 应 。 因 此 ， 我 认为 
参与 者 的 喜爱 度 ， 也 可 能 被 称 为 用 户 体验 ， 将 是 数字 时 代 研 究 设计 中 
越 来 越 重 要 的 一 部 分 。 
24.4 零 可 变 成 本 的 实验 实例 
用 有 价值 的 服务 或 愉快 的 体验 作为 对 参与 者 的 酬谢 


酬谢 方式 参考 文献 


健康 信息 网 站 Centola( 2010 ) 


锻炼 计划 Centola( 2011 ) 


Salganik, Dodds, and Watts( 2006 ) ; 


免费 音乐 
Salganik and Watts( 2008, 2009b ) 


有 趣 的 游戏 Kohli et al. ( 2012 ) 


电影 推荐 Harper and Konstan( 2015 ) 


UNA PR AE Bl ke SHY AE ARAN SEES, Wt EW RV) a ee EA 
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成 功 和 失败 的 论文 研究 来 次 明 如 何 实现 这 一 点 。 


我 的 论文 最 初 是 想 探 守 那 些 令 人 费解 的 文化 产品 的 成 功 。 热 门 歌 
曲 、 畅 销 书 和 卖座 的 电影 ， 其 人 气 指 数 比 各 自 领 域 的 平均 水 平 要 高 得 
多 。 也 正 因 如 此 ， 这 些 产 品 的 市 场 通常 被 称 为 局 家 通 吃 的 市 场 。 与 此 
同时 ， 究 竟 哪 首 歌 、 哪 本 书 或 哪 部 电影 会 成 功 ， 却 是 非常 难 预测 的 。 
u El» Kiez (William Goldman) 曾 对 大 量 学 术 研 究 做 出 了 如 下 
的 高 度 概 括 : “ 当 预 测 成 功 时 ， 没 有 人 知道 任何 事 。” 电 家 通 吃 的 市 
场 的 不 可 预测 性 让 我 很 想 知 道 文化 产品 的 成 功 多 大 程度 是 因为 质量 ， 
多 大 程度 是 因为 运气 。 或 者 ， 稍 微 换 种 方式 表达 就 是 ， 如 果 我 们 可 以 
创造 出 平行 世界 并 让 它们 独立 运转 ， 那 么 同样 的 歌曲 在 这 些 世 界 中 也 
会 受 欢 迎 吗 ? 如 果 不 会 ， 造 成 这 些 差 异 的 机 制 又 是 什么 呢 ? 


为 了 回答 这 些 问 题 ， 我 和 我 的 论文 导师 彼得 ， 多 效 (Peter 
Dodds) 、 邓 肯 。 瓦 次 开展 了 一 系列 在 线 实地 实验 。 具 体 来 说 ， 我 们 创 
建 了 一 个 叫 音乐 实验 室 (MusicLab) 的 网 站 ， 人 们 可 以 通过 该 网 站 发 
现 新 的 音乐 ， 然 后 我 们 利用 这 一 网 站 进行 了 一 系列 实验 。 我 们 通过 在 
青少年 喜欢 的 一 个 网 站 上 发 布 模 幅 广告 《图 4. 20) 以 及 媒体 广播 来 招 
募 参与 者 。 进 入 网 站 的 参与 者 需 先 签 普 知情 同意 书 ， 然 后 完成 一 项 简 


短 的 背景 问卷 ， 之 后 会 被 随机 分 入 对 照 组 或 实验 组 。 在 对 照 组 中 ， 参 
与 者 根据 给 出 的 乐队 名 和 和 歌 名 自行 决定 要 听 哪 首 歌 。 他 们 在 听 歌 的 同 
时 会 被 要 求 对 歌曲 进行 评分 ， 之 后 便 可 以 下 载 这 首 歌 〈 也 可 以 不 下 
a) 。 实 验 组 的 流程 也 是 一 样 的 ， 唯 一 的 不 同 是 参与 者 还 可 以 看 到 每 
首 歌 被 前 面 的 参与 者 下 载 的 次 数 。 此 外 ， 实 验 组 的 参与 者 还 会 被 随机 
分 配 到 8 个 所 谓 的 平行 世界 中 ， 每 个 平行 世界 都 是 独立 运转 的 〈 图 
4.21) 。 利 用 这 一 设计 ， 我 们 开展 了 两 个 相关 的 实验 。 在 第 一 个 实验 
中 ， 我 们 未 对 呈现 给 参与 者 的 表格 中 的 歌曲 进行 排序 ， 歌 曲 的 受 欢迎 
程度 不 是 很 直观 。 在 第 二 个 实验 中 ， 我 们 对 呈现 给 参与 者 的 歌曲 进行 
了 排序 ， 歌 曲 的 受 欢迎 程度 更 加 直观 (图 4. 22) 。 


FE kt 评分 4 FR Kw ”音乐 实验 室 


图 4.20 我 和 同事 用 来 为 音乐 实验 室 实验 招 慕 参与 者 的 横幅 广告 示例 (Salganik, 
Dodds, and Watts 2006) 。 经 允许 复制 自 Salganik (2007) ， 图 2. 12。 


图 4.21 音乐 实验 室 的 实验 设计 。 参 与 者 被 随机 分 入 对 照 组 或 实验 组 。 对 照 组 的 参与 
者 需 在 完全 不 知道 其 他 参与 者 的 选择 的 情况 下 做 出 选择 。 而 实验 组 的 参与 者 则 被 随 
机 分 配 到 8 个 平行 世界 ， 并 能 看 到 每 首 歌 在 其 所 在 世界 中 的 受 欢迎 程度 (根据 前 面 的 
参与 者 的 下 载 次 数 来 衡量 ) ， 但 他 们 不 会 看 到 有 关 其 他 世界 的 任何 信息 ， 他 们 甚至 
都 不 知道 其 他 世界 的 存在 。 改 编 自 Salganik，Dodds，and Watts (2006) ， 图 s1。 
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实验 1 实验 2 


图 4.22 音乐 实验 宝 实验 不 同 处 理 的 屏幕 截图 。 在 实验 1 的 实验 组 中 ， 研 究 人 员 将 歌 
曲 及 其 之 前 被 下 载 的 次 数 通 过 一 个 16X3 的 算 形 表格 呈现 给 参与 者 ， 其 中 每 个 参与 者 
所 看 到 的 歌曲 顺序 都 是 随机 分 配 的 。 在 实验 2 的 实验 组 中 ， 研 究 人 员 将 歌曲 及 其 之 前 


被 下 载 的 次 数 按 当前 受 欢迎 程度 降序 排列 呈现 给 参与 者 。 经 允许 复制 自 
Salganik (2007) ， 图 2.7 和 图 2. 8。 

我 们 发 现 每 首 歌 在 不 同 世 界 的 受 欢迎 程度 是 不 同 的 ， 这 表明 运气 
在 歌曲 的 成 功 中 起 了 重要 的 作用 。 例 如 ， 同 样 是 一 个 乐队 的 一 首 歌 ， 
在 一 个 世界 中 它 是 48 首 歌 中 最 受 欢迎 的 ， 在 男 一 个 世界 中 却 排 在 了 第 
40 位 。 同 样 的 一 首 歌 与 相同 的 另外 47 首 歌 竞 争 ， 在 一 个 世界 中 它 幸 运 
地 成 了 最 流行 的 歌曲 ， 在 其 他 世界 却 没有 。 此 外 ， 通 过 比较 两 个 实验 
的 结果 ， 我 们 发 现实 验 处 理 增加 了 这 些 市 场 磋 家 通 吃 的 性 质 ， 这 也 许 
说 明了 技巧 的 重要 性 。 但 纵 观 所 有 平行 世界 后 (只 有 这 种 设置 平行 世 
界 的 实验 才能 做 到 这 一 点 ) ， 我 们 发 现实 验 处 理 实际 上 增加 了 运气 的 
重要 性 。 而 且 令 人 惊讶 的 是 ， 越 具 吸 引力 的 歌曲 ， 运 气 对 其 成 功 越 重 
要 (图 4.23) o 


音乐 实验 室 实验 的 设计 方式 使 其 基本 上 能 够 以 零 可 变 成 本 进行 。 
首先 ， 一 切 都 是 全 自动 化 的 ， 所 以 在 我 睡觉 时 它 依旧 可 以 进行 。 其 
次 ， 给 参与 者 的 酬 到 是 免费 的 音乐 ， 所 以 不 会 产生 可 变 的 参与 者 报酬 
成 本 。 利 用 音乐 作为 酬劳 也 说 明了 有 时 需要 在 固定 成 本 和 可 变 成 本 之 
间 进 行 权衡 取舍 。 利 用 音乐 做 实验 增加 了 实验 的 固定 成 本 ， 因 为 我 必 
须 花 时 间 从 乐队 那里 获得 普 乐 的 使 用 权 ， 并 为 他 们 准备 有 关 参 与 者 对 
其 音乐 的 反 啊 的 报告 。 但 就 音乐 实验 室 实 验 来 说 ， 增 加 固定 成 本 、 减 
少 可 变 成 本 是 正确 的 做 法 ， 因 为 这 使 得 我 们 能 够 开展 在 规模 上 约 比 标 
准 实验 室 实 验 大 100 倍 的 实验 。 


实验 1 实验 2 
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图 4.23 表明 吸引 力 和 成 功 之 间 的 关系 的 音乐 实验 室 实验 结果 。 其 中 x 轴 是 对 照 组 中 
歌曲 的 市 场 份额 ， 作 为 对 歌曲 吸引 力 的 一 种 衡量 。y 轴 是 8 个 平行 世界 的 实验 组 中 相 
同 歌 曲 的 市 场 份额 ， 作 为 对 歌曲 成 功 的 一 种 衡量 。 我 们 发 现 ， 增 强 实 验 处 理 的 力 
度 ， 特 别 是 将 歌曲 布局 从 实验 1 的 方式 换 成 实验 2 的 方式 《图 4. 22) ， 会 让 成 功 变 得 
更 加 不 可 预测 ， 尤 其 是 对 那些 最 具 吸 引力 的 歌曲 来 说 。 改 编 自 Salganik，Dodds， 
and Watts (2006) ， 图 3。 


此 外 ， 音 乐 实验 室 实验 表明 ， 零 可 变 成 本 本 喘 并 不 一 定 就 是 最 终 
的 目标 ， 它 还 可 以 是 开展 一 种 新 型 实验 的 方式 。 需 要 注意 的 是 ， 尽 管 
我 们 拥有 的 参与 者 数量 大 约 是 标准 实验 室 实验 参与 者 数量 的 100 倍 ， 但 
我 们 并 没有 利用 所 有 的 参与 者 来 开展 100 次 研究 实验 处 理 效应 的 标准 实 
验 室 实 验 。 相 反 ， 我 们 做 了 一 些 不 同 的 事情 ， 你 可 以 将 其 看 作 从 心理 
学 实验 到 社会 学 实验 的 转变 (Hedström 2006) 。 我 们 在 实验 中 关注 的 
是 受 欢 迎 程度 ， 这 是 一 个 总 体 结果 ， 而 不 是 个 体 决 定 。 将 关注 反 转 移 
到 总 体 结果 上 意味 着 我 们 需要 大 约 700 名 参与 者 来 得 出 一 个 单一 的 数据 
点 《每 个 平行 世界 中 有 700 名 参与 者 ) 。 这 一 实验 规模 正 是 因为 我 们 的 
成 本 结构 才 成 为 可 能 。 忆 的 来 说 ， 如 果 研 究 人 员 想 要 研究 个 体 决 定 是 
如 何 产生 总 体 结 果 的 ， 那 么 音乐 实验 室 实验 这 样 的 分 组 实验 是 非常 令 


人 振奋 的 选择 。 在 过 去 ， 这 类 实验 面临 厦 组 织 实 施 上 的 困难 ， 但 因为 
零 可 变 成 本 数据 成 为 可 能 ， 这 些 困 难 也 正在 逐渐 消失 。 


除了 说 明 零 可 变 成 本 数据 的 好 处 之 外 ， 音 乐 实验 室 实验 还 表明 了 
这 种 方法 面临 的 一 个 挑战 ， 即 高 固定 成 本 。 就 我 的 事例 而 言 ， 我 非常 
幸运 地 遇 到 了 一 位 名 叫 彼得 。 豪 塞 尔 〈Peter Hausel) 的 出 色 的 网 站 
开发 人 员 ， 然 后 我 们 花 了 大 约 6 个 月 一 起 构建 了 上 述 实验 。 也 是 因为 我 
的 导师 邓肯 。 瓦 次 获得 了 一 些 文 持 该 类 研究 的 资助 蒜 项 ， 它 才 得 以 实 
现 。 我 们 创建 音乐 实验 室 是 在 2004 年 ， 现 在 的 技术 已 经 进步 了 ， 所 以 
现在 构建 这 样 的 实验 应 该 是 更 加 容易 了 。 但 高 固定 成 本 策略 确实 是 只 
有 那些 能 够 承担 得 起 成 本 的 研究 人 员 才 能 采用 的 。 


综 上 所 述 ， 数 字 实 验 具 有 与 模拟 实验 截然 不 同 的 成 本 结构 。 如 果 
你 想 开 展 大 规模 的 实验 ， 就 应 该 尝试 尽 可 能 降低 可 变 成 本 ， 最 好 能 降 
低 到 零 。 你 可 以 通过 使 实验 过 程 上 自动化 〈 例 如 让 计算 机 代 蔡 人 工 ) 和 
设计 人 们 目 愿 想 要 参与 的 实验 来 做 到 这 一 点 。 能 够 设计 出 具有 这 些 特 
征 的 实验 的 研究 人 员 ， 便 能 开展 过 去 不 可 能 实现 的 新 型 实验 。 但 开展 
零 可 变 成 本 实验 也 会 引发 新 的 道德 伦理 问题 ， 这 也 是 我 接 下 来 将 探讨 
的 主题 。 


4.6.2 将 道德 伦理 融入 你 的 设计 : EI, REN 


你 可 以 通过 用 非 实验 研究 替代 实验 、 改 进 处 理 和 减少 参与 者 的 数 
量 ， 使 实验 更 加 人 道 。 


针对 数字 实验 设计 的 第 二 条 建议 是 关于 道德 伦理 的 。 正 如 雷 斯 带 
添 和 范 德 里 杰 特 针对 维基 百科 谷 仓 之 星 的 实验 所 示 ， 降 低 成 本 意味 看 
道德 伦理 将 成 为 研究 设计 中 越 来 越 重要 的 一 部 分 。 除 了 我 在 第 6 章 将 描 
述 的 用 来 指导 人 体 实 验 的 伦理 框架 之 外 ， 设 计数 字 实 验 的 研究 人 员 还 


可 以 参考 另 一 个 来 源 的 道德 伦理 理念 : 指导 动物 实验 的 伦理 原则 。 励 
其 是 罗素 (Russell) AAA (Burch) 在 其 具有 里 程 碑 意义 的 《人 道 
实验 技术 原则 》 (Principles of Humane Experimental Technique) 
一 书 中 提出 的 指导 动物 实验 的 三 个 原则 : 蔡 代 、 改 进 和 减少 。 我 认 
为 ， 这 三 个 原则 稍 做 修改 后 也 可 以 被 用 来 指导 人 体 实 验 的 设计 。 


PX: 如 果 可 能 的 话 ， 用 侵害 性 更 小 的 方法 来 替代 实验 。 
。 改 进 : 改进 处 理 ， 使 其 尽 可 能 不 具 危 害 性 。 


. 减少 : 尽 可 能 减少 实验 的 参与 者 。 


我 首先 将 通过 一 个 引发 伦理 争议 的 在 线 实地 实验 来 更 具体 地 阐明 
这 三 个 原则 ， 并 加 大 家 展示 它们 是 如 何 造就 更 好 、 更 人 道 的 实验 设计 
的 。 然 后 ， 我 将 摘 述 这 三 个 原则 如 何 让 实验 设计 人 员 想 到 具体 实用 的 
优化 方案 。 


最 具 伦 理 争 议 的 数字 实地 实验 之 一 是 亚当 。 元 雷 默 (Adam 
Kramer) 、 杰 米 。 吉 约 里 (Jamie Guillory) WA HH NEHM 
(Jeffrey Hancock) 开展 的 一 项 被 称 为 “情绪 感染 ”的 实验 。 实 验 是 
在 脸谱 网 上 进行 的 ， 出 发 点 是 为 了 解决 一 些 科 学 和 实际 问题 。 当 时 ， 
脸谱 网 用 户 与 脸谱 网 互动 的 主要 方式 是 信息 流 ， 即 通过 算法 控制 的 来 
目 脸 谱 网 用 户 好 友 的 状态 更 新 。 一 些 批 评 脸 谱 网 的 人 认为 ， 因 为 信息 
流 中 大 多 是 积极 的 帖子 ， 比 如 发 一 下 最 近 的 聚会 ， 所 以 可 能 会 让 用 户 
觉得 自己 的 生活 似乎 不 如 朋友 的 精彩 ， 进 而 感到 难过 。 但 也 可 能 恰好 
相反 ， 也 许 看 到 你 的 朋友 玩 得 开心 会 让 你 也 感到 快乐 。 为 了 验证 这 两 
个 相互 矛盾 的 假设 并 进一步 了 解 一 个 人 的 情绪 如 何 被 其 朋友 的 情绪 所 
影响 ， 克 雷 默 和 同事 开展 了 一 项 实验 。 在 这 项 为 期 一 周 的 实验 中 ， 他 
们 将 大 约 70 万 名 用 户 分 成 了 4 组 : 一 个 是 “消极 减少 ”组 ， 研 究 人 员 会 
随机 屏蔽 含有 消极 词汇 (例如 “难过 ”) 的 帖子 ， 以 免 其 出 现在 这 些 
人 的 信息 流 中 ， 一 个 是 “积极 减少 ”组 ， 研 究 人 员 会 随机 屏蔽 含有 积 


极 词汇 〈 例 如 “开心 ”) 的 帖子 ， 以 免 其 出 现在 这 些 人 的 信息 流 中 ; 

另外 两 组 是 对 照 组 。 在 “消极 减少 ”组 的 对 照 组 中 ， 研 究 人 员 会 以 与 
“消极 减少 ”组 相同 的 屏蔽 率 来 随机 屏蔽 帖子 ， 但 不 会 考虑 帖子 是 消 
极 的 还 是 积极 的 。 在 “积极 减少 ”组 的 对 照 组 中 ， 研 究 人 员 进 行 了 相 
同 的 操作 。 该 实验 设计 表明 ， 适 当 的 对 照 组 并 不 总 是 一 个 不 对 其 进行 
任何 处 理 的 组 。 也 就 是 说 ， 有 时 为 了 进行 精确 的 比较 以 解答 所 研 完 的 
问题 ， 研 究 人 员 需 对 对 照 组 也 实施 一 定 的 处 理 。4 个 组 的 用 户 可 以 通过 
言 轧 流 以 外 的 其 他 脸谱 网 功能 看 到 被 屏蔽 的 其 好 友 的 帖子 。 


区 雷 默 和 同事 发 现 ， 就 “积极 减少 ”组 的 参与 者 来 次， 他们 更 新 
状态 中 积极 词汇 的 比例 下 降 了 ， 消 极 词汇 的 比例 则 上 升 了 。 而 束 “ 消 
极 减 少 ” 组 的 参与 者 来 说 ， 他 们 更 新 状态 中 积极 词汇 的 比例 上 升 了 ， 
消极 词汇 的 比例 则 下 降 了 《图 4. 24) 。 但 这 些 处 理 的 效应 量 是 很 小 
的 : 实验 组 和 对 照 组 在 积极 词汇 和 消极 词汇 上 出 现 差 异 的 概率 是 干 分 
o 
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消极 词汇 积极 词汇 消极 词汇 积极 词汇 
图 4.24 情绪 感染 的 证 据 。“ 消 极 减 少 ” 组 的 参与 者 使 用 的 消极 词汇 较 少 ， 积 极 词汇 
RB; “积极 减少 ”组 的 参与 者 使 用 的 消极 词汇 较 多 ， 积 极 词汇 较 少 。 坚 线 代 表 舍 
算 的 标准 误差 。 改 编 自 Kramer，Guillory，and Hancock (2014) ， 图 1。 
在 探讨 该 实验 引发 的 道德 伦理 问题 之 前 ， 我 想 用 本 章 前 面 的 一 些 
概念 来 描述 三 个 科学 问题 。 


首先 ， 我 们 还 不 清楚 该 实验 的 实际 细节 与 相关 理论 是 如 何 关 联 
的 。 换 句 话 次， 我 们 对 该 实验 的 构 念 效 度 尚 有 疑问 。 我 们 还 不 清楚 积 
极 词汇 和 消极 词汇 的 数量 是 否 能 很 好 地 反映 参与 者 的 情绪 状态 ， 因 为 


我 们 不 清楚 : OO) 人 们 在 帖子 中 使 用 的 词汇 是 否 能 很 好 地 反映 他 们 的 
情绪 ，《〈2) 研究 人 员 采 用 的 特定 的 情绪 分 析 技 术 是 否 能 准确 地 推断 情 
2 (Beasley and Mason 2015; Panger 2016) 。 换 句 话 说 ， 词 汇 可 能 
并 不 是 一 个 很 好 的 情绪 指标 ， 上 述 特定 的 情绪 分 析 技 术 也 可 能 并 不 是 
一 个 很 精确 的 测量 方法 。 


其 次 ， 该 实验 的 设计 和 分 析 并 没有 告诉 我 们 谁 是 受 影响 最 大 的 
( 即 没 有 对 处 理 效 应 的 异 质 性 进行 分 析 〉 ， 也 没有 告诉 我 们 可 能 的 原 
理 。 在 该 事例 中 ， 研 究 人 员 有 很 多 关于 参与 者 的 信息 ， 但 在 分 析 实 验 
时 基本 上 没有 考虑 这 些 信息 。 


最 后 ， 该 实验 中 的 效应 量 是 很 小 的 : 实验 组 和 对 照 组 出 现 差 异 的 
概率 大 约 是 干 分 之 一 。 在 他 们 的 论文 中 ， 元 雷 默 和 同事 表示 ， 这 样 的 
效应 量 也 是 很 重要 的 ， 因 为 每 天 会 有 数 以 亿 计 的 人 查看 他 们 的 信息 
流 。 换 句 话说 ， 他 们 认为 ， 即 使 对 每 个 人 的 影响 很 小 ， 但 对 数 以 亿 计 
的 人 的 影响 总 和 很 大 。 就 算 你 同意 他 们 这 个 观点 ， 这 样 的 效应 量 对 情 
绪 传播 这 样 一 个 更 为 普 壳 的 科学 问题 是 人 否 具 有 重要 意义 ， 我 们 仍然 无 
从 得 知 (Prentice and Miller 1992) 。 


除了 这 些 科 学 问题 ， 元 雷 默 和 同事 的 论文 在 《美国 国家 科学 院 院 
HI» (Proceedings of the National Academy of Sciences) 上 发 表 
后 没 几 天 就 引 来 了 研究 人 员 和 媒体 的 强烈 抗议 (具体 争论 的 观点 我 将 
在 第 6 章 更 详细 地 描述 ) 。 这 场 争论 中 提出 的 问题 致使 上 述 院 刊 罕 见地 
就 有 关 这 项 实验 的 道德 伦理 问题 和 伦理 审查 过 程 的 担忧 发 表 了 社论 
(Verma 2014) o 


描述 完 情 绪 感 染 这 一 实验 ， 现 在 我 想 说 明 的 是 ， 上 述 三 个 原则 能 
为 真正 的 研究 融 来 具体 实用 的 改进 方案 (无 论 你 个 人 如 何 看 得 这 个 特 
定 实验 的 道德 伦理 问题 )》。 第 一 个 原则 是 蔡 代 : 如 果 可 能 的 话 ， 研 究 
人 员 应 该 设法 用 侵害 性 、 风 险 性 更 小 的 方法 来 普 代 实验 。 例 如 ， 研 宪 
人 员 可 以 尝试 利用 目 然 实验 ， 而 不 是 开展 随机 对 照 实验 。 正 如 第 2 章 所 


描述 的 ， 自 然 实 验 是 指 现实 世界 中 发 生 的 事情 刚好 大 致 满足 了 对 处 理 
的 随机 分 配 ( 例 如 ， 抽 签 决 定 入 伍 人 选 )。 自 然 实验 的 伦理 优势 在 
于 ， 研 究 人 员 不 必 实 施 处 理 ， 因 为 环境 会 蔡 他 们 实施 。 例 如 ， 几 乎 就 
在 殉 雷 默 等 人 开展 情绪 感染 实验 的 同一 时 间 ， 科 维 略 〈Coviello) 和 
同事 发 现 ， 人 们 在 下 雨天 发 的 帖子 中 消极 词汇 会 比较 多 、 积 极 词汇 会 
比较 少 ， 因 此 ， 通 过 利用 天 气 的 随机 变化 ， 他 们 可 以 在 不 进行 干预 的 
情况 下 研究 信息 流 变化 的 影响 ， 这 就 好 像 是 天 气 在 蔡 他 们 开展 实验 一 
样 ， 他 们 的 这 一 实验 可 被 称 为 情绪 感染 目 然 实验 。 他 们 的 具体 步骤 有 
点 复杂 ， 但 我 们 现在 探讨 的 是 如 何 用 侵害 性 、 风 险 性 更 小 的 方法 来 答 
代 实 验 ， 所 以 他 们 的 事例 告诉 我 们 最 重要 的 一 点 是 ， 通 过 利用 上 自然 实 
验 ， 科 维 略 和 同事 可 以 在 不 开展 自己 的 实验 的 情况 下 了 解 情 绪 传 播 。 


第 二 个 原则 是 改进 : 研究 人 员 应 该 设法 改进 实验 处 理 ， 以 使 其 尽 
可 能 无 害 。 例 如 ， 研 究 人 员 可 以 增加 积极 或 消极 的 内 容 ， 而 不 是 屏蔽 
积极 或 消极 的 内 容 。 增 加 内 容 的 设计 会 改变 参与 者 信息 流 的 情绪 内 
容 ， 但 也 能 解决 批评 者 提出 的 一 个 顾虑 ， 即 实验 可 能 导致 参与 者 错过 
信息 流 中 的 重要 信息 。 在 克 雷 默 和 同事 的 设计 中 ， 重 要 信息 与 不 重要 
言 思 被 屏 珊 的 概率 是 一 样 的 。 但 在 增加 内 容 的 设计 中 ， 补 取代 的 将 会 
古 那 些 不 太 重 要 的 信息 。 


第 三 个 原则 是 减少 : 研究 人 员 应 该 设法 将 实验 参与 者 的 数量 减少 
到 完成 科学 目标 所 需要 的 最 小 数目 。 在 模拟 实验 中 ， 因 为 参与 者 的 可 
变 成 本 较 高 ， 所 以 研究 人 员 目 然 会 这 么 做 。 但 在 数字 实验 中 ， 尤 其 是 
零 可 变 成 本 的 实验 中 ， 研 究 人 员 不 会 因为 实验 的 规模 而 面临 成 本 问 
题 ， 这 就 有 可 能 导致 不 必要 的 大 规模 实验 。 


例如 ， 殉 雷 默 和 同事 就 应 该 利用 有 关 参 与 者 的 处 理 前 信息 ， 比 如 
处 理 前 的 发 帖 行为 ， 来 使 他 们 的 分 析 更 加 高 效 。 更 具体 地 说 ， 死 雷 默 
和 同事 应 该 比较 实验 组 中 积极 词汇 的 比例 变化 和 对 照 组 中 积极 词汇 的 
比例 变化 ， 而 不 是 比较 实验 组 的 积极 词汇 比例 和 对 照 组 的 积极 词汇 比 


例 。 前 者 有 时 被 称 为 混合 设计 《图 4.5) ， 有 时 也 被 称 为 双重 差分 估计 
量 法 。 也 就 是 说 ， 研 究 人 员 应 该 计算 出 每 个 参与 者 的 变化 量 〈 处 理 后 
行为 一 处 理 前 行为 )， 然 后 比较 实验 组 和 对 照 组 参与 者 的 变化 量 。 这 
种 双重 差分 的 方法 从 统计 学 角度 来 讲 会 更 加 高 效 ， 因 为 它 意 味 着 研究 
人 员 可 以 利用 更 小 的 样本 量 实现 相同 的 置信 和 度 。 


就 元 雷 默 和 同事 的 实验 而 言 ， 因 为 没有 原始 数据 ， 所 以 我 们 很 难 
确切 地 知道 双重 差分 估计 量 法 的 效率 比 原来 方法 的 效率 具体 高 出 了 多 
少 ， 但 可 以 通过 其 他 相关 的 实验 获得 一 个 大 致 的 概念 。 邓 (Deng) 等 
人 报告 称 ， 通 过 采用 其 中 一 种 双重 差分 估计 量 法 ， 他 们 将 三 个 不 同 在 
线 实验 的 估计 量 的 方差 减少 了 约 50%。 谢 (Xie) 和 奥 里 塞 
(Aurisset) 也 报告 了 类 似 的 结果 。50% 的 方差 缩减 意味 着 如 果 克 雷 默 
和 同事 采用 一 种 稍微 不 同 的 分 析 方 法 ， 那 么 他 们 所 需 的 样本 量 可 能 就 
能 减少 一 半 。 换 句 话 说 ， 稍 微 改 变 一 下 分 析 方 法 或 许 就 能 减少 35 万 名 
参与 者 了 。 


在 这 一 点 上 ， 你 可 能 会 想 研 究 人 员 为 什么 要 在 意 这 35 万 人 在 情绪 
感染 实验 中 是 否 多 余 呢 ? 这 是 因为 情绪 感染 实验 的 两 个 特性 使 我 们 有 
必要 担忧 实验 规模 过 大 ， 许 多 数字 实地 实验 都 具有 这 两 个 特征 : C1) 
不 确定 实验 是 否 会 对 至 少 茶 些 参与 者 产生 伤害 ，〈2) 参与 者 不 是 目 愿 
参与 实验 的 。 尽 可 能 缩小 具有 这 些 特征 的 实验 的 规模 似乎 是 合理 的 。 


要 证 清 的 一 点 是 ， 上 述 减 小 实验 规模 的 要 求 并 不 意味 着 你 不 应 该 
开展 大 规模 零 可 变 成 本 的 实验 。 这 只 是 意味 着 ， 实 验 规模 刚好 能 够 让 
你 实现 科学 目标 就 可 以 了 。 确 保 实 验 规 模 合适 的 一 个 重要 方法 是 进行 
功效 分 析 (Cohen 1988) 。 在 模拟 时 代 ， 研 究 人 员 通 常会 通过 功效 分 
析 来 确保 他 们 的 研究 规模 不 会 太 小 《〈 即 参与 者 过 少 ) 。 但 现在 ， 研 究 
人 员 应 该 通过 功效 分 析 来 确保 他 们 的 研究 规模 不 会 太 大 〈 即 参与 者 过 
2 


综 上 所 述 ， 蔡 代 、 改 进 和 减少 这 三 个 原则 有 助 于 研究 人 员 将 道德 
伦理 融入 实验 设计 中 。 当 然 ， 上 述 每 种 改善 情绪 感染 实验 的 方案 ， 其 
本 里 也 是 瑕 瑜 孔 见 。 例 如 ， 通 过 自然 实验 得 来 的 证 据 并 不 忆 是 像 通 过 
随机 实验 得 来 的 那样 纯粹 ， 而 且 增 加 内 容 从 逻辑 上 讲 可 能 比 屏 菩 内 容 
更 难以 实现 。 因 此 ， 提 出 这 些 改善 方案 并 不 是 为 了 事后 批评 其 他 研究 
人 员 的 决定 ， 而 是 为 了 说 明 如 何在 现实 情况 下 应 用 这 三 个 原则 。 事 实 
上 ， 在 研究 设计 中 ， 权 衡 取 售 的 问题 一 直 都 存在 ， 而 且 在 数字 时 代 ， 
这 些 权衡 将 越 来 越 涉 及 道德 伦理 方面 的 考虑 。 稍 后 在 第 6 革 ， 我 将 给 出 
一 些 有 助 于 研究 人 员 理解 和 探讨 这 些 权衡 取 售 的 原则 以 及 道德 伦理 框 


口 
架 。 


4.7 结论 


数字 时 代 使 研究 人 员 能 够 开展 以 前 不 可 能 的 实验 。 研 究 人 员 不 仅 
可 以 开展 大 规模 的 实验 ， 还 可 以 利用 数字 实验 的 特殊 性 质 提 高 效 度 ， 
评估 处 理 效应 的 异 质 性 ， 以 及 弄 清楚 原理 。 这 些 实验 可 以 在 完全 数字 
化 的 环境 中 进行 ， 也 可 以 在 物理 世界 中 使 用 数字 设备 来 进行 。 


正如 本 童 所 示 ， 这 些 实验 可 以 与 有 能 力 的 公司 合作 开展 ， 也 可 完 
全 由 研究 人 员 目 行 开展 。 而 且 并 不 是 只 有 在 大 型 科技 公司 工作 的 人 才 
能 开展 数字 实验 。 如 果 要 目 己 设计 实验 ， 你 可 以 尝试 将 你 的 可 变 成 本 
降低 到 零 ， 并 通过 蔡 代 、 改 进 和 减少 这 三 个 原则 ， 将 道德 伦理 融入 设 
计 中 。 研 究 人 员 对 数 百 万 人 生活 的 干预 能 力 在 不 断 增 强 ， 这 就 意味 痢 
我 们 同样 应 该 越 来 越 关 注 研究 设计 是 否 符合 道德 伦理 要 求 。 能 力 越 
大 ， 贡 任 越 大 。 


第 5 革 ”进行 大 规模 协作 


5.1 简介 


维基 百科 是 不 可 思议 的 。 志 愿 者 的 大 规模 协作 创造 了 这 样 一 部 每 
个 人 都 能 使 用 的 百科 全 书 。 维 基 百 科 成 功 的 关键 不 是 新 知识 ， 而 是 新 
的 协作 形式 。 幸 运 的 是 ， 数 字 时 代 使 许多 新 形式 的 协作 成 为 可 能 。 因 
此 ， 我 们 现在 应 该 想 想 : 有 哪些 重大 的 科学 问题 ， 我 们 单独 无 法 解决 
的 问题 ， 是 现在 通过 协作 能 够 解决 的 ? 


当然 ， 科 研 协 作 已 经 不 是 什么 新 鲜 事 了 ， 新 鲜 的 是 数字 时 代 使 我 
们 能 够 与 数量 更 多 、 更 多 样 化 的 人 进行 协作 : 全 世界 能 够 上 网 的 数 十 
亿 人 。 我 预计 这 些 新 的 大 规模 协作 将 产生 惊人 的 结果 ， 不 仅 是 因为 它 
们 所 涉及 的 人 数 ， 还 因为 这 些 人 所 具有 的 多 种 多 样 的 技能 和 视角 。 我 
们 如 何 才 能 让 每 个 互联 网 用 户 都 参与 我 们 的 研究 过 程 呢 ? 如 果 你 有 100 
名 研究 助理 ， 你 能 做 什么 ”如 果 有 10 万 名 熟练 的 协作 者 呢 ? 


现在 有 许多 种 形式 的 大 规模 协作 ， 计 算 机 科学 家 通常 会 根据 技术 
特点 把 它们 分 成 大 量 的 类 别 (Quinn and Bederson 2011) 。 然 而 在 本 
章 中 ， 我 将 根据 它们 能 如 何 被 用 于 社会 研究 来 分 类 。 具 体 来 说 ， 我 认 
为 将 它们 大 致 分 为 三 种 类 型 的 项 目 是 有 帮助 的 : 人 本 计算 、 公 开 募 集 
和 分 布 式 数据 采集 《图 5.1) 。 


图 5.1 大 规模 协作 示意 图 。 本 章 将 围绕 三 种 主要 形式 的 大 规模 协作 展开 论述 : 人 本 
计算 、 公 开 募 集 和 分 布 式 数据 采集 。 更 一 般 地 讲 ， 大 规模 协作 将 源 于 公众 科学 、 众 
包 和 集体 智慧 等 领域 的 想法 结合 了 起 来 。 

我 将 在 本 草 后 面部 分 更 详细 地 描述 每 一 类 型 的 项 目 ， 但 现在 先 让 
我 简单 描述 一 下 每 个 类 型 。 人 本 计算 项 目 非常 适合 任务 简单 、 数 量 庞 
大 的 问题 ， 例 如 给 100 万 张 图 片 贴 上 标签 。 这 类 项 目 在 过 去 可 能 是 由 作 


为 研究 助理 的 大 学 生来 完成 的 。 为 这 类 项 目 做 出 贡献 不 需要 具备 与 任 
务 相 关 的 技能 ， 并 且 最 终 的 输出 通常 是 所 有 页 献 的 平均 值 。 人 本 计算 
项 目的 一 个 经 典 示 例 是 星系 动物 园 (Galaxy Zoo) ， 在 这 个 项 目 中 ， 
10 万 名 志愿 者 协助 天 文学 家 对 100 万 个 星系 进行 了 分 类 。 公 开 筋 集 项 目 
则 非常 适合 为 明确 公式 化 的 问题 寻找 新 奇 的 、 令 人 意 想 不 到 的 答案 。 
这 类 问题 在 过 去 可 能 需要 请 教 同行 。 为 这 类 项 目 做 出 页 献 需要 具备 与 
任务 相关 的 专业 技能 ， 且 最 终 的 输出 通常 是 所 有 页 献 中 最 好 的 那 一 个 
方案 。 公 开 勇 集 项 目的 一 个 经 典 示 例 是 网 飞 奖 ， 在 这 个 项 目 中 ， 成 千 
上 万 的 科学 家 和 黑客 致力 于 开发 新 的 算法 来 预测 用 尸 对 电影 的 评价 。 
最 后 ， 分 布 式 数据 采集 项 目 非常 适合 大 规模 的 数据 采集 。 这 类 项 目 在 
过 去 可 能 是 由 作为 研究 助理 的 大 学 生 或 调查 研究 公司 来 完成 的 。 为 这 
类 项 目 做 出 页 献 通常 能 够 接触 到 研究 人 员 无 法 接触 到 的 数据 采集 点 ， 
且 最 终 的 产品 就 是 所 有 页 献 的 简单 合并 。 分 布 式 数据 采集 项 目的 一 个 
经 典 示 例 是 观 鸟 数据 库 CeBird) ， 在 这 个 项 目 中 ,成 干 上 万 的 志愿 者 
会 页 献 有 关 他 们 所 看 到 的 乌 类 的 报告 。 


大 规模 协作 在 天 文学 (Marshall, Lintott, and Fletcher 
2015) 和 生态 学 (Dickinson, Zuckerberg, and Bonter 2010) 等 领 
域 有 着 丰富 而 悠久 的 历史 ， 但 在 社会 研究 中 还 不 和 常见。 但是， 通过 拉 
述 其 他 领域 的 成 功 项 目 并 提供 一 些 关 键 的 组 织 原 则 ， 我 希望 能 让 大 家 
相信 两 件 事 。 首 先 ， 大 规模 协作 可 以 被 用 于 社会 研究 。 其 次 ， 使 用 大 
规模 协作 的 研究 人 员 将 能 够 解决 以 前 似乎 不 可 能 解决 的 问题 。 虽 然 倡 
导 大 规模 协作 的 人 经 常会 说 采用 大 规模 协作 能 够 省 钱 ， 但 其 实 它 的 优 
点 远 不 止 于 此 。 正 如 我 将 要 展示 的 ， 大 规模 协作 不 仅 能 让 我 们 以 更 便 
宜 的 方式 开展 研究 ， 还 能 让 我 们 把 研究 做 得 更 好 。 


在 本 章 之 前 的 章节 中 ， 大 家 已 经 明白 了 用 下 述 三 种 不 同 的 方式 与 
人 互动 能 了 解 到 什么 : 观察 他 们 的 行为 “第 2 章 ) 、 回 他 们 提问 《第 3 
E) 和 招 努 他 们 来 参与 实验 (第 4 章 ) 。 在 本 章 中 ， 我 将 问 大 家 展示 ， 
做 我 们 的 研究 协作 者 能 了 解 到 什么 。 对 于 上 述 三 种 主要 形式 的 大 规模 
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的 可 能 方式 。 本 章 最 后 将 介绍 5 个 有 助 于 你 设计 目 己 的 大 规模 协作 项 目 
的 原则 。 


5.2 人 本 计算 


人 本 计算 要 解决 的 是 很 宏大 的 问题 。 我 们 需要 先 将 每 个 问题 分 解 
成 多 个 简单 的 问题 ， 然 后 将 分 解 后 的 问题 发 布 给 志愿 者 ， 最 后 再 将 结 
RER: 


在 人 本 计算 项 目 中 ， 每 个 人 接 到 的 都 是 简单 的 小 任务 ， 但 将 所 有 
人 的 成 果 整 合 后 就 能 解决 那些 对 一 个 人 来 说 过 于 宏大 的 问题 。 如 果 兽 
有 一 个 研究 问题 让 你 产生 了 这 样 的 想法 一 一 如 果 我 有 1000 名 研究 助 
理 ， 就 能 解决 这 个 问题 ， 那 么 这 个 问题 就 适合 用 人 本 计算 来 解决 。 


人 本 计算 项 目的 一 个 典型 示例 是 星系 动物 园 。 在 这 个 项 目 中 ， 超 
过 10 万 名 志愿 者 对 大 约 100 万 个 星系 的 图 像 进行 了 分 类 ， 而 且 其 准确 度 
与 早期 对 星系 图 像 进行 分 类 的 专业 天 文学 家 的 准确 度 兰 不 多 ， 但 天 文 
学 家 所 分 类 的 图 像 的 数量 要 少 得 多 。 这 次 大 规模 协作 完成 了 对 更 多 图 
像 的 分 类 ， 进 而 使 天 文学 家 对 星系 是 如 何 形成 的 有 了 新 的 发 现 ， 他 们 
DREAMS MERMA “See.” (Green Peas) 的 全 新 星系 。 


尽管 星系 动物 园 似乎 与 社会 研究 不 太 沾 边 ， 但 其 实在 很 多 情形 
下 ， 社 会 研究 人 员 也 想 对 图 像 或 文本 进行 编码 、 分 类 或 标示 。 在 有 些 
情况 下 ， 这 类 分 析 可 以 利用 计算 机 来 完成 ， 但 有 些 形式 的 分 析 对 计算 
机 来 说 很 难 ， 而 对 人 来 说 很 简单 。 正 是 这 些 对 人 来 说 简单 、 对 计算 机 
来 说 很 难 的 微 任务 ， 可 以 通过 人 本 计算 来 完成 。 


不 仅 是 星系 动物 园 中 的 微 任务 很 具 普 记性 ， 该 项 目的 结构 也 很 具 


普遍 性 。 星 系 动 物 园 以 及 其 他 人 本 计算 项 目 通 常 都 采用 分 解 - 运用 - 
整合 这 一 策略 (Wickham 2011) , 一旦 你 理解 了 这 个 策略 ， 就 能 用 它 


来 解决 许多 问题 。 首 先 ， 一 个 大 问题 会 被 分 解 成 许多 小 问题 。 然 后 ， 
运用 人 力 来 独立 解决 每 个 小 问题 。 最 后 ， 将 人 力 解 决 的 结果 整合 ， 形 
成 一 个 一 致 的 解决 方案 。 在 此 背景 下 ， 让 我 们 来 看 看 分 解 - 运用 - 整 
合 这 一 策略 在 星系 动物 园 中 古 如 何 被 使 用 的 。 


5.2.1 星系 动物 园 


星系 动物 园 凝 聚众 多 志愿 者 之 力 对 100 万 个 星系 进行 了 分 类 。 


星系 动物 园 是 2007 年 牛津 大 学 天 文学 研究 生 纠 文 ， 肖 文 斯 基 
(Kevin Schawinski) 为 解决 他 所 面临 的 一 个 问题 而 想到 的 。 简 单 来 
说 束 是 ， 肖 文 斯 基 对 星系 很 感 兴 趣 ， 而 人 们 可 以 根据 星系 的 形态 〈 椭 
圆 形 或 螺旋 形 ) IDEE KERZE) 对 它们 进行 分 类 。 当 时 ， 天 文 
学 家 的 传统 观点 是 ， 像 我 们 的 银河 系 这 样 的 螺旋 星系 的 颜色 是 蓝 色 的 
(意味 着 年 轻 ) ， 而 椭圆 星系 的 颜色 则 是 红色 的 (意味 着 年 老 ) . A 
文 斯 基 对 这 一 传统 观点 有 所 怀疑 。 他 狂想， 尽管 上 述 规律 一 般 来 讲 是 
正确 的 ， 但 也 可 能 有 相当 数量 的 星系 例外 ， 通 过 研究 这 些 不 符合 预期 
规律 的 不 同 寻常 的 星系 ， 他 便 能 对 星系 的 形成 过 程 有 所 了 解 。 


因此 ， 为 了 推翻 传统 观点 ， 肖 文 斯 基 裔 要 的 是 大 量 按 形 态 分 类 的 
星系 ， 也 就 是 已 被 划分 为 螺旋 形 或 椭圆 形 的 星系 。 但 问题 是 现 有 的 分 
类 算法 还 不 足以 用 于 科学 研究 。 换 句 话 说 ， 在 当时 ， 分 类 星系 对 计算 
机 来 说 是 一 项 很 难 的 任务 。 因 此 ， 肖 文 斯 基 需 要 的 是 大 量 人 工分 类 的 
星系 。 带 着 研究 生 的 热忱 ， 肖 文 斯 基 开 始 了 分 类 工作 。 经 过 7 天 每 天 12 
小 时 的 马拉松 式 奋 战 ， 他 共 对 5 万 个 星系 进行 了 分 类 。 尽 管 5 万 个 星系 
听 起 来 可 能 很 多 ， 但 其 实 仅 占 斯 隆 数 字 天 空 勘测 计划 (Sloan Digital 
Sky Survey) 所 担 摄 的 将 近 100 万 个 星系 的 大 约 5%。 首 文 斯 基 意 识 到 他 
需要 采取 一 个 更 具 扩 展 性 的 方法 。 


幸运 的 是 ， 对 星系 进行 分 类 并 不 需要 人 们 接受 有 关 天 文学 的 高 深 
培训 ， 你 可 以 很 快 就 教会 一 个 人 如 何 进 行星 系 分 类 。 换 句 话说 ， 尽 管 
星系 分 类 对 计算 机 来 说 是 一 项 困难 的 任务 ， 对 人 来 说 却 是 非常 简单 
的 。 因 此 ， 当 肖 文 斯 基 和 同学 殉 里 斯 。 林 托 特 (Chris Lintott) 坐 在 
牛津 大 学 附近 的 一 家 小 酒馆 时 ， 他 们 想到 了 创建 一 个 网 站 ， 然 后 让 志 
愿 者 对 星系 的 图 像 进行 分 类 。 几 个 月 后 ， 星 系 动物 园 诞 生 了 。 


在 星系 动物 园 的 网 站 上 ， 志 愿 者 需 接受 儿 分 钟 的 训练 。 例 如 ， 了 
解 螺旋 星系 和 椭圆 星系 的 区 别 ( 图 5. 2) 。 完 成 该 训练 后 ， 每 个 志愿 者 
必须 通过 一 项 相对 简单 的 考试 ， 即 正确 地 将 15 个 星系 中 的 11 个 进行 分 
类 ， 然 后 就 能 开始 通过 一 个 简单 的 基于 网 络 的 界面 《图 5. 3) 对 未 知 星 
系 进行 真正 的 分 类 了 。 从 志愿 者 到 天 文学 家 的 转变 在 不 到 10 分 钟 内 囊 
完成 了 ， 而 且 只 需 跨 越 最 低 的 门槛 一 一 一 个 简单 的 测试 。 


椭圆 星系 螺旋 星系 


图 5.2 椭圆 星系 和 螺旋 星系 这 两 类 主要 星系 的 示例 。 星 系 动物 园 通 过 10 多 万 名 志愿 
者 对 约 100 万 张 图 像 进 行 了 分 类 。 经 允许 复制 自 GalaxyZoo. org 和 斯 隆 数 字 天 空 勘测 
计划 。 

在 一 份 报纸 报道 了 该 项 目 之 后 ， 星 系 动物 园 吸 引 来 了 第 一 批 志愿 
者 ， 然 后 在 大 约 6 个 月 的 时 间 里 ， 项 目 吸 引 了 超过 10 万 名 公民 科学 家 ， 
人 们 之 所 以 参与 是 因为 他 们 喜欢 这 项 任务 ， 并 且 想 要 帮助 推进 天 文学 


的 发 展 。 这 10 万 名 志愿 者 总 共 页 献 了 4000 多 万 条 分 类 信息 ， 其 中 大 部 
分 分 类 信息 是 由 一 些 相对 较 少 的 核心 参与 者 完成 的 (Lintott et al. 
2008) 。 
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MM show Grid Overlay on the next Image 
图 5.3 志愿 者 被 要 求 对 单个 图 像 进 行 分 类 的 输入 屏 。 根 据 斯 隆 数 字 天 空 勘测 计划 所 
拍摄 的 一 张 图 片 ， 经 克 里 斯 。 林 托 特 允 许 复制 而 来 。 

有 雇用 大 学 生 做 研究 助理 经 验 的 研究 人 员 可 能 会 立刻 对 数据 质量 
产生 怀疑 。 尽 管 这 种 怀疑 是 合理 的 ， 但 星系 动物 园 这 一 项 目 表明 ， 志 
愿 者 所 贡献 的 数据 经 正确 地 清洗 、 消 除 偏 差 和 整合 后 也 能 产生 高 质量 
的 结果 (Lintott et al. 2008) 。 让 公众 创造 出 专业 质量 数据 的 一 个 
重要 技巧 就 是 重复 开展 ， 即 让 许多 不 同 的 人 来 执行 相同 的 任务 。 在 星 
系 动物 园 这 一 项 目 中 ， 志 愿 者 对 每 个 星系 都 贡献 了 大 约 40 条 分 类 数 
据 ， 这 种 程度 的 重复 率 是 雇用 大 学 生 做 研究 助理 的 研究 人 员 永 远 都 无 
法 达到 的 ， 因 为 他 们 需要 更 加 关注 每 个 个 体 分 类 数据 的 质量 。 志 愿 者 
用 重复 弥补 了 他 们 在 训练 方面 的 欠缺 。 


尽管 不 同志 愿 者 对 同一 星系 进行 了 多 重 分 类 ， 但 要 想 把 这 些 多 重 
分 类 数据 结合 起 来 以 得 出 一 个 一 致 的 分 类 还 是 很 困难 的 。 鉴 于 大 多 数 
人 本 计算 项 目 遇 到 的 挑战 都 非常 相似 ， 所 以 简要 回顾 一 下 星系 动物 园 
研究 人 员 得 出 一 致 分 类 的 三 个 步 又 很 有 帮助 。 


首先 ， 研 究 人 员 通 过 删除 虚假 分 类 清洗 了 了 数据。 例如， 那些 反复 
对 同一 星系 进行 分 类 如果 有 人 试图 操纵 结果 可 能 束 会 这 么 做 ) 的 人 
会 被 删除 所 有 的 分 类 数据 。 这 类 清洗 及 其 他 类似 清洗 所 删除 的 数据 约 
占 总 分 类 数据 的 4%。 


然后 ， 研 究 人 员 需 要 消除 清洗 后 的 分 类 数据 中 的 系统 偏 产 。 通 过 
一 系列 租 入 在 原始 项 目 中 的 偏差 检测 研究 ， 例 如 给 一 些 志愿 者 呈现 黑 
白 的 而 不 是 彩色 的 星系 图 像 ， 研 究 人 员 发 现 了 多 个 系统 偏差 ， 例 如 把 
因 距 离 遥 远 而 外 表 模 糊 的 螺旋 星系 划分 成 桶 圆 星 系 〈Bamford et al. 
2009) 。 调 整 这 些 系 统 偏差 非常 重要 ， 因 为 重复 分 类 也 无 法 自动 消除 
系统 俩 和 兰 ， 重 复 分 类 只 是 有 助 于 消除 随机 误差 。 


最 后 ， 研 究 人 员 需 要 用 一 种 方法 把 消除 偏差 后 的 个 体 分 类 数据 结 
合 起 来 ， 得 出 一 个 一 致 的 分 类 。 将 每 个 星系 的 所 有 分 类 数据 结合 起 来 
的 最 简单 的 方法 是 选择 最 剃 见 的 分 类 数据 。 但 这 就 意味 大 每 个 志愿 者 
的 权重 是 一 样 的 ， 而 研究 人 员 则 认为 有 些 志 愿 者 要 比 其 他 志愿 者 更 擅 
长 分 类 。 因 此 ， 他 们 开发 了 一 个 更 复杂 的 友人 代 加 权 程 序 ， 试 图 检测 出 
最 好 的 分 类 数据 并 赋予 它们 更 多 的 权重 。 


因此 ， 经 过 清洗 、 偏 差 消 除 和 加 权 这 三 个 步骤 后 ， 星 系 动物 园 的 
研究 团队 将 4000 万 条 志愿 者 的 分 类 数据 转化 成 了 一 组 一 致 的 形态 分 
类 。 在 将 这 些 形 态 分 类 与 之 前 三 次 由 专业 天 文学 家 进行 的 小 规模 星系 
分 类 《其 中 包括 为 星系 动物 园 的 诞生 贡献 了 部 分 灵感 的 肖 文 斯 基 所 进 
行 的 分 类 ) 进行 比较 后 发 现 ， 它 们 之 间 的 吻合 度 很 高 。 因 此 ， 将 志愿 
者 的 贡献 整合 后 也 能 得 出 高 质量 的 分 类 数据 ， 而 且 其 规模 是 研究 人 员 
个 人 无 法 企及 的 (Lintott et al. 2008) 。 事 实 上， 通过 对 如 此 大 量 
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红色 的 ， 许 多 论文 都 提 及 了 这 一 发 现 (Fortson et al. 2011) o 


人 至此， 大 家 应 该 明白 了 星系 动物 园 是 如 何 草 循 分 解 - 运用 - 整合 
这 一 策略 的 ， 这 一 策略 也 家用 于 大 多 数 人 本 计算 项 目 。 首先 ， 把 一 个 
大 问题 分 解 成 多 个 小 问题 。 以 星系 动物 园 为 例 就 是 ， 对 100 万 个 星系 进 
行 分 类 这 个 大 问题 被 分 解 成 了 100 万 个 对 一 个 星系 进行 分 类 的 小 问题 。 
然后 ， 分 别 运 用 人 力 对 每 个 小 问题 进行 操作 。 以 星系 动物 园 为 例 就 
征 ， 志 愿 者 将 每 个 星系 划分 为 螺旋 形 或 顶 圆 形 。 最 后 ， 整 合 所 有 结 末 
以 得 出 一 个 一 致 的 结果 。 以 星系 动物 园 为 例 就 是 ， 通 过 清洗 、 偶 差 消 
除 和 加 权 ， 得 出 每 个 星系 的 一 致 分 类 。 尽 管 大 多 数 项 目 都 会 永 用 这 一 
通用 的 策略 ， 但 需要 根据 所 处 理 的 具体 问题 对 每 个 步骤 进行 相应 的 调 
整 。 例 如 ， 下 面 这 个 人 本 计算 项 目 采 用 的 也 是 这 个 策略 ， 但 运用 和 整 
合 这 两 个 步 又 是 截然 不 同 的 。 


对 星系 动物 园 的 团队 来 说 ， 这 个 项 目 仅仅 是 个 开始 。 很 快 他 们 便 
意识 到 ， 尽 管 能 对 将 近 100 万 个 星系 进行 分 类 ， 但 这 个 规模 还 不 足以 配 
合 新 的 大 约 能 拍 到 100 亿 个 星系 的 数字 天 衬 勘 测 (Kuminski et al. 
2014) 。 要 想 应 对 从 100 万 到 100 亿 的 增长 ， 也 就 是 10000 倍 的 增长 ， 他 
们 需要 招募 的 参与 者 数量 大 致 是 星系 动物 园 这 个 项 目的 10000 倍 。 尽 管 
互联 网 上 的 志愿 者 很 多 ， 但 也 不 是 无 限 的 。 因 此 ， 研 究 人 员 意 识 到 ， 
如 果 他 们 想 要 处 理 数 据 量 日 益 增 多 的 数据 ， 就 需要 一 个 新 的 、 更 具 扩 
展 性 的 方法 。 


于 是 ， 曼 达 。 班 纳 吉 (Manda Banerji) 同 肖 文 斯 基 、 林 托 特 和 星 
系 动物 园 团 队 的 其 他 成 员 一 起 ， 开 始 教 计算 机 进行 星系 分 类 。 更 具体 
地 说 就 是 ， 班 纳 吉 利用 星系 动物 园 所 创建 的 人 工分 类 数据 建立 了 一 个 
机 器 学 习 模 型 ， 它 能 够 根据 图 像 特征 预测 星系 的 人 工分 类 结果 。 如 果 


该 模型 的 预测 精度 很 高 的 话 ， 那 么 星系 动物 园 的 研究 人 员 基 本 就 能 用 
它 对 无 限 的 星系 进行 分 类 了 。 


班 纳 吉 和 同事 方法 的 核心 实际 上 和 社会 研究 中 常用 的 技术 非常 相 
似 ， 尽 管 乍 一 看 这 种 相似 性 可 能 并 不 明显 。 首 先 ， 班 纳 吉 和 同事 将 每 
张 图 像 转 化 成 了 一 组 概括 其 性 质 的 数字 特征 。 例 如 ， 星 系 图 像 可 以 有 
三 个 特征 : 图像 中 蓝 色 像素 点 数量 、 像 素 亮 度 方差 、 非 白 像 素 比 例 。 
选择 正确 的 特征 是 这 一 问题 的 重要 部 分 ， 这 通常 需要 专业 领域 的 专业 
知识 。 这 第 一 步 通 常 被 称 为 特征 工程 ， 经 过 这 一 步 ， 班 纳 吉 和 同事 构 
建 了 一 个 数据 矩阵 ， 每 一 张 图 集 都 由 一 行 和 三 列 数据 描述 。 根 据 该 数 
所 矩阵 和 期 望 输出 值 ( 例 如 ， 如 采用 人 工分 类 ， 菏 一 图 像 是 否 会 被 划 
分 为 椭圆 星系 )， 研 究 人 员 可 以 构建 一 个 统计 或 机 器 学 习 模 型 ， 例 如 
逻辑 回归 ， 以 此 根据 图 像 的 特征 预测 人 工分 类 的 结果 。 最 后 ， 研 究 人 
员 可 以 利用 该 统计 模型 中 的 参数 预测 出 新 的 星系 的 分 类 〔 图 5. 4) 。 在 
机 器 学 习 中 ， 这 种 利用 标签 示例 创建 一 个 能 标记 新 数据 的 模型 的 方法 
被 称 为 监督 式 学 习 。 


班 纳 吉 和 同事 的 机 器 学 习 模 型 的 特征 ， 比 我 下 面 这 个 虚构 的 小 例 
子 的 特征 要 复杂 得 多 。 在 这 个 例子 中 ， 研 究 人 员 选 择 “ 德 伏 古 勒 轴 
E.” (de Vaucouleurs fit axial ratio) 这 样 的 性 质 作 为 特征 ， 使 
用 的 模型 也 不 是 逻辑 回归 ， 而 是 一 个 人 工 神 经 网 络 。 利 用 选择 好 的 特 
征 、 模 型 和 星系 动物 园 的 一 致 分 类 ， 她 算出 了 每 个 特征 的 权重 ， 然 后 
利用 这 些 权 重 对 星系 的 分 类 进行 预测 。 例 如 ， 她 经 过 分 析 发 现 ，“ 德 
伏 古 勒 轴 比 ” 较 低 的 图 像 更 有 可 能 属于 螺旋 星系 。 有 了 这 些 权重 ， 她 
便 能 相对 准确 地 预测 一 个 星系 的 人 工分 类 结果 了 。 
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图 5.4 班 纳 吉 等 人 利用 星系 动物 园 的 分 类 数据 训练 一 个 机 器 学 习 模型 进行 星系 分 类 
的 简化 示意 图 。 星 系 图 像 被 转换 成 了 一 个 特征 矩阵 。 在 这 个 简化 的 例子 中 ， 星 系 图 
像 有 三 个 特征 (图 像 中 蓝 色 像素 点 数量 、 像 素 亮 度 方差 、 非 白 像 素 比 例 ) 。 然 后 ， 
他 们 利用 星系 动物 园 的 分 类 数据 训练 一 个 机 器 学 习 模型 。 最 后 ， 他 们 利用 这 个 机 器 
学 习 模 型 预测 星系 动物 园 分 类 数据 中 未 涉及 的 其 他 星系 的 分 类 。 我 称 之 为 计算 机 辅 
助人 本 计算 项 目 ， 因 为 它 不 是 让 人 来 解决 问题 ， 而 是 让 人 构建 一 个 数据 集 ， 然 后 用 
这 个 数据 集训 练 计算 机 来 解决 问题 。 这 种 计算 机 辅助 人 本 计算 系统 的 优点 是 ， 它 能 
让 你 用 有 限 的 人 力 处 理 几 乎 无 限 的 数据 。 星 系 图 像 经 允许 复制 自 斯 隆 数 字 天 空 勘测 
计划 。 


班 纳 吉 和 同事 的 工作 让 星系 动物 园 变 成 了 我 所 说 的 计算 机 辅助 人 
本 计算 系统 。 对 这 类 混合 系统 最 好 的 解读 方式 是 ， 它 们 不 是 让 人 来 解 
决 问 题 ， 而 是 让 人 构建 一 个 数据 集 ， 然 后 用 这 个 数据 集训 练 计 算 机 来 
解决 问题 。 有 时 ， 训 练 计算 机 来 解雇 问题 需要 大 量 的 示例 ， 而 获得 足 
够 数量 示例 的 唯一 方法 就 是 大 规模 协作 。 这 种 计算 机 辅助 方法 的 优点 
是 它 能 让 你 用 有 限 的 人 力 处 理 几 乎 无 限 的 数据 。 例 如 ， 一 个 拥有 100 万 
个 星系 的 人 工分 类 数据 的 研究 人 员 可 以 构建 一 个 预测 模型 ， 然 后 用 这 
个 模型 对 10 亿 甚至 10000 亿 个 星系 进行 分 类 。 如 果 星 系 的 数量 很 庞大 ， 
那么 这 种 人 与 计算 机 的 混合 系统 将 是 唯一 可 能 的 解决 办 法 。 然 而 这 种 
无 限 的 可 扩展 性 并 不 是 没有 成 本 的 。 构 建 一 个 能 够 正确 预测 人 工分 类 
结果 的 机 器 学 习 模 型 本 身 就 是 一 个 难题 ， 但 幸好 已 经 有 一 些 针 对 这 一 
主题 的 优秀 书籍 了 (Hastie, Tibshirani, and Friedman 2009; 
Murphy 2012; James et al. 2013) 。 


星系 动物 园 很 好 地 表明 了 许多 人 本 计算 项 目 是 如 何 逐 步 发 展 的 。 
首先 ， 一 个 研究 人 员 会 自行 或 与 一 小 组 研究 助理 一 起 尝试 开展 一 个 项 
目 〈 例 如 首 文 斯 基 最 初 所 进行 的 分 类 ) 。 如 果 这 个 方法 在 规模 上 不 能 
满足 要 求 ， 那 么 研究 人 员 束 会 选择 采用 有 许多 参与 者 的 人 本 计算 。 但 
在 数据 量 达 到 一 定 规模 后 ， 单 纯 依靠 人 力 就 不 足以 解决 问题 了 。 在 这 
种 时 候 ， 研 究 人 员 就 需要 构建 一 个 计算 机 辅助 人 本 计算 系统 ， 利 用 人 
工分 类 数据 训练 一 个 基本 能 够 处 理 无 限 数 据 的 机 器 学 习 模 型 。 


5.2.2 政治 宣言 的 公众 编码 


由 专家 进行 的 政治 宣言 编码 也 可 以 通过 人 本 计算 来 完成 ， 后 


通常 
:能 实现 更 大 的 再 现 性 和 灵活 性 。 


者 还 


与 星系 动物 园 的 发 起 人 相似 ， 社 会 研究 人 员 在 许多 情况 下 也 想 对 
图 像 或 文本 进行 编码 、 分 类 或 标注 。 其 中 一 个 例子 就 是 对 政治 宣言 进 
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言 。 例 如 ， 以 下 就 是 一 则 英国 工党 在 2010 年 的 宣言 : 


在 我 们 的 公共 服务 体系 中 工作 的 数 百 万 名 工作 人 员 ， 他 们 践 行 着 
英国 最 棠 高 的 价值 观 为 让 人 们 能 够 充分 利用 他 们 的 生命 而 贡献 自 
己 的 力量 并 保护 他 们 免 受 那些 不 应 独自 承受 的 风险 的 伤害 。 正 如 我 们 
需要 让 政府 在 使 市 场 公平 运作 方面 扮演 更 加 果敢 的 角色 ， 我 们 也 需要 
果敢 地 对 政府 进行 改革 。 


对 于 政治 科学 家 ， 尤 其 是 那些 研究 竞选 和 政策 辩论 动态 的 政治 科 
学 家 来 说 ， 这 些 宣言 包含 了 非常 有 价值 的 数据 。 为 了 系统 地 从 这 些 宣 
言 中 提取 信息 ， 研 究 人 员 创 建 了 一 个 宣言 项 目 ， 共 搜集 了 50 个 国家 的 
近 1000 个 政党 所 发 表 的 4000 则 宣言 ， 然 后 组 织 政治 科 学 家 采用 56 类 方 
案 对 每 则 宣言 的 每 句 话 进行 了 系统 的 编码 ， 最 终 建立 了 一 个 庞大 的 数 
据 集 ， 整 合 了 这 些 宣言 中 所 包含 的 信息 。 目 前 已 有 200 多 篇 科学 论文 使 
用 了 该 数据 集 。 


Ae RH + MÍ TL (Kenneth Benoit) 和 同事 决定 把 以 前 由 专家 进 
行 的 宣言 编码 转化 成 一 个 人 本 计算 项 目 。 于 是 ， 他 们 创建 了 一 个 更 具 
再 现 性 和 灵活 性 的 编码 过 程 ， 其 低 成 本 和 人 快速 就 更 不 在 话 下 。 


贝 努 瓦 和 同事 采用 分 解 - 运用 - 整合 这 一 策略 ， 让 来 自 微 任务 劳 
动力 市 场 ( 机 器 人 MTurk 和 众 包 公司 CrowdFlower 都 是 微 任务 劳动 力 市 
场 的 例子 ， 更 多 有 关 该 类 市 场 的 内 容 可 参见 第 4 草 ) IN TAM RAM 
1987 年 到 2010 年 间 的 6 次 大 选 所 发 表 的 18 则 宣言 进行 了 编码 。 首 先 ， 人 研 
究 人 员 将 每 则 宣言 分 解 为 一 个 个 句子 。 然 后 ， 工 人 运用 编码 方案 对 每 
句 话 进行 编码 。 具 体 来 说 ， 他 们 被 要 求 将 每 句 话 归 类 为 经 济 政策 ( 偏 
Aa) 、 社 会 政策 (自由 主义 或 保守 主义 ) 或 两 者 都 不 是 (图 
5.5) 。 每 句 话 都 大 约 有 5 个 不 同 的 人 对 其 进行 分 类 。 最 后 ， 在 考虑 个 
人 因素 影响 和 句子 难度 影响 的 前 提 下 ， 研 究 人 员 利用 一 个 统计 模型 对 


所 有 分 类 数据 进行 整合 。 最 终 贝 努 瓦 和 同事 从 大 约 1500 名 工人 那里 搜 
集 了 20 万 条 分 类 数据 ， 

图 5.5 贝 努 瓦 等 人 的 编码 方案 。 工 人 被 要 求 将 每 名 话 归 类 为 经 济 政策 〈 偏 左 或 偏 
右 ) 、 社 会 政策 《自由 主义 或 保守 主义 ) 或 两 者 都 不 是 。 改 编 自 Benoit et al. 
(2016) ， 图 1。 

为 了 评估 上 述 公 众 编码 的 质量 ， 贝 努 所 和 同事 还 让 大 约 10 名 专 
家 ， 即 政治 科学 领域 的 教授 和 研究 生 ， 用 类 似 的 步骤 对 相同 的 宣言 进 
行 了 编码 。 尽 管 公众 分 类 的 个 体 一 致 性 低 于 专家 ， 但 经 过 整合 所 得 出 
的 公众 一 致 分 类 数据 与 专家 一 致 分 类 数据 吻合 度 非常 高 《图 5.6) 。 与 
星系 动物 园 一 样 ， 上 述 比较 表明 人 本 计算 项 目 也 能 产生 高 质量 的 结 
Ro 


图 5.6 在 对 英国 政党 发 表 的 18 则 宣言 进行 编码 时 ， 公 众 编码 评估 结果 与 专家 编码 评 
估 结 果 吻合 度 非常 高 。 上 述 宣言 是 6 次 大 选 《1987 年 、1992 年 、1997 年 、2001 年 、 
2005 年 和 2010 年 ) 期 间 三 个 政党 (保守 党 、 工 党 和 自由 民主 党 ) 所 发 表 的 。 改 编 自 
Benoit et al. (2016) ， 图 3。 


在 此 基础 上 ， 贝 努 岂 和 同事 利用 他 们 的 公众 编码 方法 ， 开 展 了 宣 
言 项 目 专 家 无 法 完成 的 研究 。 例 如 ， 宣 言 项 目的 编码 方案 并 没有 涉及 
移民 这 一 话题 ， 因 为 在 制订 编码 方案 的 20 世 纪 80 年 代 中 期 ， 移 民 并 不 
征 一 个 很 突出 的 话题 。 但 让 宣言 项 目 团队 返回 去 重新 编码 他 们 的 宣言 
以 获取 这 一 信息 在 组 织 实施 上 是 不 可 行 的 。 因 此 ， 有 兴趣 研究 移民 政 
治 的 研究 人 员 似 乎 不 太 走 运 。 但 贝 努 所 和 同事 利用 他 们 的 人 本 计算 方 
法 可 以 轻松 且 快 速 地 进行 这 一 编码 。 


为 了 研究 移民 政策 ， 他 们 对 英国 2010 年 大 选 期 间 8 个 政党 所 发 表 的 
宣言 进行 了 编码 。 每 则 宣言 中 的 每 个 句子 都 需 按 照 其 是 否 与 移民 有 关 
来 编码 ， 如 果 有 关 ， 还 要 判断 是 文 持 移民 、 中 立 ， 还 是 反对 移民 。 项 
目 局 动 后 5 个 小 时 内 ， 他 们 就 搜集 到 了 22000 多 条 回复 ， 总 成 本 是 360 美 
元 。 而 且 ， 公 众 的 评估 结果 与 之 前 专家 的 评估 结果 吻合 度 非常 高 。 
个 月 之 后 ， 他 们 又 让 公众 对 相同 的 宣言 进行 了 一 次 编码 ， 作 为 最 后 的 


检测 。 然 后 ， 他 们 在 几 小 时 内 便 创建 了 一 个 新 的 与 最 初 的 公众 编码 数 
据 集 高 度 匹 配 的 公众 编码 数据 集 。 换 句 话 说 ， 人 本 计算 使 研究 人 员 能 
够 生成 与 专家 评估 一 致 的 政治 文本 编码 数据 ， 而 且 该 数据 还 具有 再 现 
性 。 此 外 ， 因 为 人 本 计算 快速 且 便 宜 ， 所 以 他 们 可 以 很 容易 地 根据 移 
民政 策 这 一 特定 的 研究 问题 来 调整 他 们 的 数据 采集 。 


5.2.3 结论 


人 本 计算 能 让 你 拥有 1000 名 研究 助理 。 


人 本 计算 项 目 能 够 通过 凝聚 许多 非 专业 人 士 的 力量 ， 解 决 那 些 计 
算 机 难以 轻易 解决 的 任务 简单 、 数 量 庞大 的 问题 。 这 类 项 目 会 采取 分 
解 - 运用 - 整合 这 一 策略 将 一 个 大 问题 分 解 成 许多 简单 的 、 没 有 专业 
技能 的 人 也 能 完成 的 微 任 务 。 计 算 机 辅助 人 本 计算 系统 还 会 利用 机 右 
学 习 放 大 人 工 成 果 的 意义 。 


在 社会 研究 中 ， 当 研究 人 员 想 要 对 图 像 、 视 频 或 文本 进行 分 类 、 
编码 或 标注 时 ， 最 有 可 能 用 到 人 本 计算 。 他 们 最 终 的 目的 通常 并 不 是 
分 类 ， 而 是 在 分 类 的 基础 上 进行 分 析 。 例 如 ， 研 究 人 员 可 以 将 对 政治 
宣言 公众 编码 数据 的 分 析 ， 作 为 对 政治 辩论 动态 这 一 更 大 课题 的 分 析 
的 一 部 分 。 效 果 最 好 的 可 能 是 不 需要 参与 者 接受 专门 的 训练 且 参 与 者 
对 任务 的 正确 答 采 有 着 广泛 共识 的 分 类 微 任务 。 如 果 分 类 任务 更 具 主 
观 性 ， 例 如 判断 “这 篇 新 闻 报 道 有 侦 见 吗 ”， 那 么 了 解 参 与 者 是 谁 以 
及 他 们 的 答案 可 能 会 有 怎样 的 俩 兰 将 变 得 更 加 重要 。 最 后 ， 人 本 计算 
项 目的 输出 质量 取决 于 人 工 输入 的 质量 : 输入 垃圾 ， 则 输出 垃圾 。 


为 了 进一步 增强 你 对 人 本 计算 的 直觉 ， 表 5. 1 还 列 出 了 将 人 本 计算 
用 于 社会 研究 的 其 他 例子 。 该 表格 表明 ， 与 星系 动物 园 不 同 的 是 ， 许 
多 其 他 人 本 计算 项 目 使 用 的 是 微 任 务 区 动力 市 场 〈 例 如 机 器 人 MTurk 平 


台 ) ， 即 其 依靠 花 钱 雇 人 完成 任务 ， 而 不 是 依靠 志愿 者 来 完成 。 当 我 
提供 有 关 如 何 创建 自己 的 大 规模 协作 项 目的 建议 时 ， 将 再 回 到 参与 者 
激励 这 个 话题 。 


表 5.1 社会 研究 中 的 人 本 计算 项 目的 例子 


政党 宣言 编码 微 任 务 劳动 力 市 场 


从 有 关 美 国 200 个 城市 的 占 
领 抗议 的 新 闻 文 章 中 提取 事 文 微 任务 劳动 力 市 场 Adams( 2016 ) 
件 信息 
Budak, Goel, and 


月 纸 文章 分 类 文本 | 微 任务 劳动 力 市 场 
报纸 分 类 微 任务 劳动 力 市 场 pas COTES 


从 第 一 次 世界 大 战士 兵 的 日 
记 中 提取 事件 信息 


发 现 地 图 中 的 变化 1% 微 任务 劳动 力 市 场 | Soeller et al.( 2016 ) 


志愿 者 Grayson (2016 ) 


Porter, Verdery, and 


ad dd MUERA BIH Gaddis ( 2016 ) 


Boa, AN WAPI F AH, MARU AER ARMS. AX 
erro 是 研究 生 。 在 数字 时 代 之 
前 ， 一 个 对 百 万 星系 进行 分 类 的 项 目 应 该 需要 花费 大 量 时 间 和 人 金钱 ， 
因此 可 能 只 有 资金 充足 和 有 耐心 的 教授 才能 够 开展 。 现 在 却 不 同 了 。 
人 本 计算 项 目 通 过 凝聚 许多 非 专 业 人 士 的 力量 ， 也 能 解决 那些 任务 简 
单 、 数 量 庞大 的 问题 。 接 下 来 我 将 癌 大 家 展示 ， 大 规模 协作 也 适用 于 
需要 专业 知识 的 问题 ， 而 这 种 专业 知识 有 时 甚至 连 研究 人 员 目 己 也 不 
具备 。 


5.3 公开 征集 


公开 征集 旨 在 为 明确 具体 的 目标 征集 新 想法 ， 它 适用 于 “检验 解 
决 方案 比 想 出 解决 方案 更 容易 ”的 情形 。 


就 上 一 小 市 所 描述 的 人 本 计算 问题 来 说 ， 研 究 人 员 是 知道 如 何 解 
决 这 些 问 题 的 ， 只 是 没有 足够 的 时 间 。 也 就 是 说 ， 如 果 地 文 。 首 文 斯 
基 有 无 限 的 时 间 的 话 ， 他 自己 也 能 完成 对 100 万 个 星系 的 分 类 。 然 而 有 
时 候 ， 研 究 人 员 所 面临 的 挑战 不 是 来 自 规模 方面 ， 而 十 来自 任务 本 二 
固有 的 难度 。 在 过 去 ， 面 临 这 类 挑战 的 研究 人 员 可 能 会 癌 同事 寻求 帮 
助 。 而 现在 ， 这 类 问题 还 可 以 通过 创建 一 个 公开 征集 项 目 来 解决 。 如 
果 你 曾 想 过 “我 不 知道 该 如 何 解 决 这 个 问题 ， 但 我 确信 一 定 有 人 知 
道 ”， 那 么 就 可 以 通过 公开 征集 解决 这 个 问题 。 


在 公开 征集 项 目 中 ， 研 究 人 员 首 先 提出 一 个 问题 ， 向 许多 人 征集 
解决 方案 ， 然 后 从 解决 方案 中 挑选 最 好 的 。 把 一 个 对 自己 来 说 很 有 挑 
战 性 的 问题 当 作 研究 诬 题 ， 然 后 借助 公众 来 解决 这 个 问题 ， 这 似乎 有 
扩 奇 尾 ， 但 我 希望 通过 计算 机 科学 、 生 物 学 和 法 律 领域 的 三 个 例子 ， 
让 大 家 相信 这 种 方法 很 有 效 。 这 三 个 例子 表明 ， 创 建 一 个 成 功 的 公开 
招 委 项 目 ， 关 键 在 于 仔细 设计 你 的 问题 ， 尽 管 难以 想 出 其 解决 方案 ， 
但 你 可 以 让 该 解决 方案 易于 检验 。 然 后 在 本 小 节 的 最 后 ， 我 将 更 多 地 
描述 如 何 将 这 些 想法 应 用 于 社会 研究 。 


5.3.1 网 飞 奖 


3 


飞 奖 通过 公开 征集 来 预测 人 们 会 喜欢 哪 部 电影 。 


EE TO E o HB BS 
司 ， 它 于 2000 年 推出 了 电影 匹配 CCinematch) ， 一 个 向 用 户 推荐 电影 
的 服务 系统 。 例 如 ， 电 影 轧 配 可 能 注意 到 你 豆 欢 《星球 大 战 》 和 《 弟 
国 反 击 战 》， 然 后 据 此 癌 你 推荐 《绝地 归来 》。 起 初 ， 电 影 匹 配 的 表 
现 差 强人 意 。 在 过 去 的 许多 年 里 ， 它 一 直 在 不 断 提 高 预测 用 户 喜好 的 
能 力 。 到 2006 年 ， 电 影 匹 配 却 停滞 不 前 了 。 网 飞 的 研究 人 员 几 乎 尝试 
了 所 有 他 们 能 想到 的 东西 ， 但 同时 他 们 猜想 可 能 还 有 其 他 想法 能 帮助 
改进 这 个 系统 。 于 是 ， 他 们 想到 了 一 个 在 当时 来 说 非常 前 卫 的 解决 方 
案 : 公开 征集 。 


对 网 飞 奖 最 终 的 成 功 起 到 至 关 重 要 作用 的 是 公开 征集 的 设计 ， 这 
个 设计 对 公开 征集 如 何 才能 被 用 于 社会 研究 也 有 者 重要 的 借鉴 意义 。 
网 飞 并 没有 像 许 多 第 一 次 接触 公开 征集 这 个 概念 的 人 设想 的 那样 提出 
一 个 没有 条 理 的 征集 想法 ， 而 是 提出 了 一 个 明确 且 其 解决 方案 易于 检 
验 的 想法 : 要 求人 们 利用 1 亿 条 电影 评分 数据 来 预测 300 万 条 评分 留存 
数据 (网 飞 没 有 公布 的 用 户 评 分 数据 》。 第 一 个 开发 出 预测 精度 比 电 
影 匹配 高 10% 的 算法 的 人 ， 将 获得 100 万 美元 的 奖金 。 而 检验 该 算法 的 
方法 束 是 比较 其 预测 评分 与 网 飞 的 留存 评分 ， 这 一 明确 且 易 行 的 检验 
方案 意味 着 网 飞 奖 的 设计 遵循 了 这 样 的 理念 : 让 检验 解决 方 末 比 想 出 
解决 方案 更 容易 。 它 将 改进 电影 匹配 的 挑战 变 成 了 一 个 适 于 用 公开 征 
集 来 解决 的 问题 。 


2006 年 10 月 ， 网 飞 公 开 了 一 个 数据 集 ， 其 中 包含 了 大 约 50 万 名 用 
户 的 1 亿 条 电影 评分 信息 (我 们 将 在 第 6 章 中 讨论 这 一 行为 涉及 的 隐私 
问题 )》。 这 些 数据 可 以 被 转化 成 一 个 巨大 的 矩阵 ， 其 中 大 约 有 50 万 名 
用 户 、2 万 部 电影 以 及 大 约 1 亿 条 从 1 星 到 5 星 的 电影 评分 信息 《〈 表 
5.2) 。 网 飞 的 要 求 束 是 利用 矩阵 中 的 观测 数据 预测 300 万 条 留存 评 
e 


25.2 网 飞 奖 数据 简 表 


用 户 500 000 


世界 各 地 的 研究 人 员 和 黑客 都 被 这 一 挑战 吸引 了 ， 到 2008 年 ， 已 
有 超过 3 万 人 参与 其 中 (Thompson 2008) 。 在 比赛 过 程 中 ， 网 飞 收 到 
了 来 自 5000 多 个 团队 的 超过 40000 个 解决 方案 提议 (Netflix 2009) o 
显然 ， 网 飞 无 法 阅读 并 理解 所 有 这 些 方案 。 但 整 件 事 情 进 展 很 顺利 ， 
因为 网 飞 很 容易 对 解决 方案 进行 验证 。 网 飞 只 需 让 一 台 计 算 机 按照 预 
先 指定 的 度量 标准 (他 们 当时 采用 的 度量 标准 是 均 方 误差 的 平方 根 ) 
对 预测 评分 和 留存 评分 进行 比较 即 可 。 正 是 这 种 快速 评估 解决 方案 的 
能 力 ， 使 网 飞 能 够 评估 每 个 团队 的 解决 方案 ， 而 事实 证 明 这 一 点 很 重 
要 ， 因 为 好 的 创意 确实 来 自 一 些 令 人 惊讶 的 地 方 。 事 实 上 ， 获 胜 的 解 
决 方案 来 自 一 个 由 三 位 没有 电影 推荐 系统 构建 经 验 的 研究 人 员 所 组 建 
的 团队 (Bell, Koren, and Volinsky 2010) . 


PY RR BOBO RE A) — EA TR ARE EA RIVA. re 
说 ， 当 人 们 上 传 预测 评分 数据 时 ， 无 须 上 传 学 历 、 年 龄 、 种 族 、 人 性 
别 、 性 取向 或 其 他 任何 有 关 个 人 的 信息 。 斯 坦 福 大 学 一 位 着 名 教授 的 
预测 评分 与 一 位 青少年 在 其 卧室 中 完成 的 预测 评分 所 接受 的 评估 是 完 
全 相同 的 。 不 幸 的 是 ， 大 多 数 社会 研究 却 不 是 这 样 的 。 也 就 是 说 ， 对 
大 多 数 社会 研究 来 说 ， 评 估 是 非常 耗 时 的 ， 而 且 在 一 定 程 度 上 是 其 有 
主观 性 的 。 所 以 ， 大 多 数 的 研究 想法 从 来 都 没有 被 认真 评估 过 ， 而 且 
在 评估 时 ， 评 佑 者 也 很 难 完 全 不 考虑 提出 者 身份 这 一 因素 。 而 公开 征 


集 项 目 则 有 着 公平 易 行 的 评估 体系 ， 所 以 它 可 以 发 现 那些 如 果 采 用 其 
他 方法 束 会 被 忽略 的 想法 。 


例如 ， 在 比赛 期 间 ， 有 一 个 账 扎 名 为 西蒙 。 耸 殉 (Simon Funk) 
的 人 在 他 的 博客 上 发 布 了 一 个 基于 奇异 值 分 解 的 解决 方案 提议 ， 这 是 
一 个 线性 代数 的 方法 ， 其 他 参与 者 都 未 曾 提 到 这 一 方法 。 分 元 这 篇 博 
文 既 专业 又 很 奇怪 地 不 太 正 式 。 它 描述 的 是 一 个 好 的 解决 方案 ， 还 是 
完全 没 用 的 东西 ? 如 果 这 不 是 一 个 公开 征集 项 目的 话 ， 该 解决 方案 可 
能 永远 也 不 会 被 认真 评估 。 上 毕竟 ， 西 蒙 。 芬 殉 并 不 是 及 省 理工 学 院 的 
一 位 教授 ， 他 只 是 一 名 软件 开发 人 员 ， 当 时 正在 新 西 兰 背包 旅行 
(Piatetsky 2007) 。 如 果 他 当时 通过 邮件 把 这 个 想法 发 送 给 网 飞 的 
一 位 工程 师 ， 那 么 几乎 可 以 肯定 的 是 ， 这 位 工程 师 并 不 会 认真 评估 这 
个 想法 。 


幸运 的 是 ， 因 为 网 飞 奖 的 评估 标准 很 明确 且 评 估 易 于 实施 ， 所 以 
芬 元 的 预测 评分 得 到 了 评估 ， 而 且 结 果 很 快 就 出 来 了 ， 他 的 方法 显然 
非常 有 效 : 他 的 排名 一 下 子 奖 升 到 了 第 4 位 。 考 虑 到 其 他 团队 在 这 个 问 
题 上 已 经 奋战 了 数 月 ， 这 无 疑 是 一 个 尺 人 的 结果 。 最 后 ， 几 乎 所 有 认 
真 对 待 这 次 比赛 的 竞争 者 都 采用 了 他 的 部 分 方法 (Bell, Koren, and 
Volinsky 2010) 。 


西蒙 。 分 区 选择 通过 一 篇 博文 来 曾 述 他 的 方法 ， 而 不 是 试图 避免 
让 别人 知道 这 个 方法 ， 这 也 表明 网 飞 奖 的 许多 参与 者 并 不 仅仅 是 因为 
百 万 美元 的 奖金 才 参 与 比赛 的 。 更 确切 地 说 ， 许 多 参与 者 似乎 也 是 为 
了 享受 这 个 问题 所 带 来 的 智力 挑战 和 由 此 而 形成 的 团体 (Thompson 
2008) ， 我 觉得 许多 研究 人 员 都 能 够 理解 这 种 感觉 。 


网 飞 奖 是 公开 征集 的 一 个 经 典 示 例 。 网 飞 提出 了 一 个 有 者 明确 目 
标 《〈“ 预 测 电影 评分 ) 的 问题 ， 并 癌 许 多 人 征集 该 问题 的 解决 方案 。 网 
飞 之 所 以 能 够 评估 所 有 这 些 解决 方案 ， 是 因为 验证 这 些 解决 方 采 要 比 
想 出 解决 方案 更 加 容易 。 最 终 ， 网 飞 经 过 验证 挑选 出 了 最 好 的 解决 方 


A E AE SS NA AS 
领域 ， 并 且 是 在 没有 百 万 美元 奖金 的 情况 下 。 


5.3.2 BAW BUFR, 


EQ BARR (Foldit) 可 以 让 非 专业 人 士 以 一 种 有 趣 的 方式 
参与 进来 。 


网 飞 交 尽管 很 经 典 且 明确 易 履 ， 但 通过 它 并 不 能 阐明 公开 征集 项 
目的 所 有 内 容 。 例 如 ， 在 网 飞 奖 项 目 中 ， 大 多 数 认 真 对 符 比 赛 的 参与 
者 都 受过 多 年 统计 学 和 机 器 学 习 方面 的 训练 。 但 公开 征集 项 目 其 实 也 
可 以 让 没有 接受 过 正式 训练 的 人 参与 ， 和 集 白 质 扩 共 游 戏 束 是 这 样 。 


人生 白 质 折合 是 将 氨基 酸 链 折 僵 形成 一 定形 状 的 过 程 。 通 过 更 好 地 
理解 这 一 过 程 ， 生 物 学 家 可 以 设计 出 具有 特定 形状 的 、 能 被 用 作 药 物 
Nae At. Pi, RAIN SS Rea KINA, BEA 
质 内 部 各 种 推力 、 拉 力 达 到 平衡 状态 时 的 一 种 结构 〈 图 5.7) 。 所 以 ， 
如 果 一 个 研究 人 员 想 要 预测 蝇 白质 的 折合 形状 ， 其 做 法 听 起 来 其 实 很 
简单 :只 需 尝 试 所 有 可 能 的 构象 并 计算 出 每 种 构象 的 能 量 ， 然 后 预测 
重 白 质 将 折合 成 能 量 最 低 的 构象 即 可 。 不 过 的 是 ， 尝 试 所 有 可 能 的 构 
象 从 计算 上 来 讲 是 不 可 能 的 ， 因 为 可 能 的 构象 有 数 十 亿 种 。 即 便 用 现 
在 最 强大 的 计算 机 来 做 ， 在 可 预见 的 未 来 ， 这 样 的 蛮 力 也 不 会 起 作 
用 。 因 此 ， 生 物 学 家 开发 了 许多 巧妙 的 算法 来 有 效 地 寻找 最 低能 量 的 
构象 。 但 是 ， 尽 管 在 科学 和 计算 方面 付出 了 巨大 的 努力 ， 这 些 算法 还 
是 远 远 不 够 完善 。 


图 5.7 Sana e. 


华盛顿 大 学 的 戴 维 。 贝 克 (David Baker) 和 他 的 研究 小 组 同 许 多 
科学 家 一 样 致 力 于 研究 蛋白 质 折 县 的 计算 方法 。 在 一 个 项 目 中 ， 贝 死 
和 同事 开发 了 一 个 系统 ， 志 愿 者 可 以 利用 空闲 时 间 在 他 们 的 计算 机 上 
通过 这 一 系统 模拟 重 白 质 折 合 。 作 为 回报 ， 他 们 所 模拟 的 折 车 方案 可 
以 成 为 他 们 计算 机 的 屏幕 保护 图 。 然 后 ， 一 些 志愿 者 写 信 给 见 元 和 他 
的 同事 说 ， 他 们 认为 如 果 自 己 能 参与 计算 ， 惑 能 提高 计算 机 在 预测 蛋 
日 质 折 共 方 面 的 性 能 。 于 是 乍 白质 折 闭 游戏 便 诞生 了 (Hand 2010) 。 


乍 白 质 折 苔 游戏 将 集 白 质 的 折合 过 程 变 成 了 一 个 任何 人 都 可 以 玩 
的 游戏 。 从 玩家 的 角 度 来 看 ， 梨 日 质 扩 僵 游戏 束 像 是 一 个 拼图 游戏 
(图 5.8) 。 玩 家 会 看 到 一 个 杂乱 无 章 的 香 白 质 三 维 结构 图 ， 然 后 通过 
“调整 ”、“ 扭 转 ” 和 “重组 ”这 些 操作 来 改变 它 的 形状 ， 同 时 玩家 
的 分 数 也 会 因此 而 增加 或 减少 。 重 要 的 是 ， 分 数 是 根据 当前 构象 的 能 
量 高 低 来 计算 的 ， 能 量 越 低 ， 得 分 越 高 。 换 句 话 说， 分 数 有 助 于 指导 
玩家 寻找 低能 量 的 构象 。 就 像 网 飞 奖 的 电影 评分 预测 一 样 ， 重 白质 折 
登 游 戏 所 呈现 的 也 是 一 个 “检验 解决 方案 比 想 出 解决 方案 更 容易 ”的 
情形 ， 也 正 因 如 此 ， 这 个 游戏 才 得 以 诞生 。 


图 5.8 和 蛋白质 折 登 游戏 的 游戏 画面 。 
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能 与 专家 设计 的 最 佳 算 法 竞争 。 尽 管 大 多 数 玩 家 者 不 是 特别 擅长 ， 但 
也 有 少量 个 体 玩家 和 小 团队 玩家 例外 。 事 实 上 ， 在 玩家 与 最 先进 的 算 
法 的 正面 交锋 中 ， 玩 家 的 打 有 登 方案 更 胜 一 筹 的 概率 是 50% (Cooper et 
ale. 20109 5 


集 白 质 折 登 游戏 和 网 飞 奖 在 许多 方面 都 不 一 样 ， 但 它们 都 公开 征 
集 解决 方案 ， 而 且 都 是 “检验 解决 方案 比 想 出 解决 方案 更 容易 ”。 现 
在 ， 我 们 将 在 为 一 个 非常 不 同 的 领域 看 到 相同 的 结构 ， 专 利 法 。 最 后 
这 个 公开 征集 的 例子 表明 ， 这 一 方法 也 适用 于 看 起 来 不 是 很 易于 量化 
的 情形 。 


5. 3. 3 公众 专利 评审 


公众 专利 评审 是 一 项 帮助 专利 审查 员 发 现 现 有 技术 的 公开 征集 项 
目 。 它 表明 公开 征集 也 可 以 被 用 于 不 易 量 化 的 问题 。 


专利 审查 员 的 工作 是 很 辛 否 的 。 他 们 会 收 到 关于 新 发 明 的 、 简 洁 
的 、 如 律师 般 措 辞 严 谨 的 描述 文件 ， 然 后 必须 决定 该 发 明 是 否 “ 新 
祝 ”。 也 就 是 说 ， 审 查 员 必 须 审 查 是 否 存 在 会 使 所 陈述 的 发 明 无 法 获 
得 专利 的 “ 现 有 技术 ”之 前 已 有 对 所 陈述 发 明 的 描述 文件 ) 。 我 们 
可 以 通过 一 个 名 叫 阿尔 伯 特 (为 了 纪念 阿尔 伯 特 。 爱 因 斯 坦 ) 的 专利 
审查 员 来 理解 这 个 过 程 是 如 何 运 作 的 。 阿 尔 伯 特 的 职业 生涯 开始 于 瑞 
士 专利 局 ， 他 可 能 会 收 到 一 份 类 似 于 美国 专利 20070118658 的 申请 。 美 
国 专 利 20070118658 是 惠普 为 其 “用 户 可 选 省 理 警 报 格 式 ” 所 申请 的 ， 
由 丝 。 诺 维 克 (Beth Noveck) 的 《维基 政府 》 (Wiki Government) 
中 有 关于 这 项 专利 的 大 量 摘 述 。 以 下 是 这 个 专利 申请 的 第 一 条 权利 要 


一 个 计算 机 系统 包括 : 一 个 处 理 器 、 一 个 包括 逻辑 指令 的 基本 输 
入 /输出 系统 (BIOS) 。 当 处 理 器 执行 该 逻辑 指令 时 ， 它 便 会 对 处 理 器 
进行 如 下 配置 : 在 一 个 计算 设备 的 基本 输入 /输出 系统 中 启动 开机 自 检 
(POST) ， 在 用 户 界面 中 呈现 一 个 或 多 个 管理 警报 格式 ， 从 用 户 界 面 
接收 选择 信号 ， 识 别 用 户 界 面 中 所 显示 的 其 中 一 个 管理 警报 格式 ， 以 
及 用 已 识别 的 管理 警报 格式 配置 一 个 与 计算 系统 相连 的 设备 。 


阿尔 伯 特 是 否 应 该 授予 这 项 申请 20 年 的 垄断 权 呢 ?是 否 存 在 会 使 
它 无 法 获得 专利 的 现 有 技术 ?许多 专利 的 利害 关系 很 大 ， 但 不 过 的 
是 ， 阿 尔 伯 特 不 得 不 在 没有 太 多 他 可 能 需要 的 信息 的 情况 下 做 出 这 个 
决定 。 因 为 有 大 量 的 专利 申请 积压 ， 所 以 阿尔 伯 特 一 直 在 巨大 的 时 间 
压力 下 工作 ， 审 查 时 间 只 有 20 个 小 时 ， 然 后 他 必须 做 出 决定 。 此 外 ， 
由 于 正在 审查 的 发 明 需 要 保密 ， 所 以 这 项 工作 也 不 允许 阿尔 伯 特 咨询 
外 部 专家 (Noveck 2006) 。 


这 一 状况 让 法 学 教授 贝 丝 ， 诺 维 元 感到 很 困惑 。2005 年 7 月 ， 在 一 
定 程度 上 受 维基 百科 的 启发 ， 她 写 了 一 篇 标题 为 《公众 专利 评审 : 一 
个 小 的 提议 》 的 博文 ， 呼 吁 建立 一 个 公众 专利 评审 制度 。 通 过 与 美国 
专利 商标 局 以 及 IBM (国际 商业 机 器 公司 〉 等 领先 科技 公司 合作 ， 公 众 
专利 评审 于 2007 年 6 月 正式 启动 了 。 一 个 是 有 将 近 200 年 历史 的 政府 官 
僚机 构 ， 一 个 是 律师 群体 ， 它 们 似乎 都 不 太 可 能 寻求 创新 ， 但 公众 专 
利 评审 巧妙 地 为 每 个 人 找到 了 一 个 利益 平衡 点 。 


以 下 是 公众 专利 评审 的 工作 流程 《图 5.9) 。 在 发 明 者 同意 对 他 的 
申请 进行 公开 审 但 后 〈 稍 后 我 会 分 析 这 个 人 这 么 做 的 可 能 原因 ) ， 其 
申请 就 会 被 上 传 到 一 个 网 站 。 然 后 ， 由 公众 审查 人 员 《〈 稍 后 我 会 分 析 
他 们 这 么 做 的 可 能 原因 ) 组 成 的 审 碍 小 组 对 这 一 申请 进行 讨论 ， 并 和 奉 
找 、 标 注 和 上 传 与 之 相似 的 现 有 技术 。 这 一 过 程 会 一 直 进 行 ， 直 到 审 
碍 小 组 最 终 投票 选 出 最 有 可 能 与 之 相似 的 10 个 现 有 技术 为 止 ， 然 后 他 
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行进 行 审 得， 然后 结合 来 目 公 众 专利 评审 的 意见 做 出 最 终 判 断 。 


1 冲 2) 3)» 4) 5 
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图 5.9 公众 专利 评审 的 工作 流程 。 复 制 自 Bestor and Hamp (2010) o 


让 我 们 再 次 回 到 有 关 “ 用 户 可 选 绾 理 警 报 格 式 ” 的 美国 专利 
20070118658 这 个 话题 。 这 个 专利 是 在 2007 年 6 月 被 上 传 至 公众 专利 评 
审 的 ， 然 后 IBM 的 高 级 软件 工程 师 史 带 夫 ，。 皮 尔 还 (Steve Pearson) 
看 到 了 这 个 专利 的 内 容 。 皮 尔 逊 对 这 一 研究 领域 很 熟悉 ， 并 找到 了 一 
个 现 有 技术 文献 : 一 本 标题 为 《主动 管理 技术 : 快速 参考 指南 》 
(Active Management Technology: Quick Reference Guide) 的 英 特 
尔 的 指南 手册 ， 这 本 手册 在 两 年 前 就 出 版 了 。 在 这 份 文 件 以 及 其 他 现 
有 技术 文献 和 公众 专利 评审 中 审理 小 组 讨论 的 基础 上 ， 一 名 专利 审 碍 
员 开 始 对 该 专利 进行 彻底 的 审查 ， 并 最 终 撤销 了 该 项 技术 的 专利 权 ， 
部 分 原因 束 是 皮尔 逊 肥 现 的 英特尔 的 指南 手册 (Noveck 2009) 。 在 通 
过 公众 专利 评审 所 完成 的 66 个 专利 申请 中 ， 有 近 30% 主 要 是 因为 评审 小 
组 发 现 的 现 有 技术 而 被 拒绝 授予 专利 权 的 〈Bestor and Hamp 
2010) 。 


公众 专利 评审 设计 的 巧妙 之 处 ， 在 于 它 为 有 许多 利益 冲突 的 相关 
方 提 供 了 一 个 和 谐 协 作 的 平台 。 发 明 者 之 所 以 参与 是 因为 通过 公众 专 
利 评审 所 提交 的 申请 ， 要 比 走 传统 的 秘密 审 碍 程序 的 申请 更 快 获得 专 
利 局 的 审查 。 公 众 审 但 人 员 之 所 以 参与 是 为 了 防止 低 质 量 专利 产生 ， 
而 且 许 多 人 似乎 党 得 这 个 过 程 很 有 趣 。 最 后 ， 专 利 局 和 专利 审查 员 之 
所 以 参与 是 因为 这 个 方法 只 会 改善 他 们 的 审查 结果 。 也 就 是 说 ， 如 宋 


评审 小 组 发 现 的 是 10 个 无 用 的 现 有 技术 文献 ， 那 么 专利 审查 员 将 它们 
忽略 挥 即 可 。 换 句 话说 ， 有 公众 审查 人 员 与 专利 审查 员 一 起 合作 ， 应 
该 比 专利 审查 员 独 自 奋 战 要 好 ， 这 至少 也 应 该 能 达到 与 专利 审查 员 独 
目 奋 战 相 同 的 效果 。 因 此 ， 公 开征 集 并 不 总 是 代 蔡 专家 解决 问题 ， 有 
时 是 帮助 专家 把 他 们 的 工作 做 得 更 好 。 


尽管 公众 专利 评审 与 网 飞 奖 和 和 集 日 质 折合 游戏 不 太一 样 ， 但 它们 
都 有 一 个 相似 的 结构 ， 即 “检验 解决 方案 比 想 出 解决 方案 更 容易 ”。 
一 旦 有 人 找到 了 《主动 管理 技术 : 快速 参考 指南 》 这 本 手册 ， 那 么 核 
实 这 个 文件 是 否 是 现 有 技术 就 容易 了 ， 人 至 少 对 专利 审查 员 来 说 是 这 样 
的 。 然 而 发 现 这 本 手册 是 相当 困难 的 。 公 众 专利 评审 还 表明 ， 公 开征 
集 有 时 也 适用 于 不 是 很 易于 量化 的 问题 。 


5.3.4 结论 


公开 征集 可 以 让 你 为 那些 你 能 清楚 地 描述 但 无 法 自己 解决 的 问题 
找到 解决 方案 。 


在 上 述 三 个 公开 征集 的 项 目 ， 即 网 飞 奖 、 和 集 白 质 折 胎 游戏 和 公众 
专利 评审 中 ， 研 究 人 员 痢 是 先 提 出 一 个 特定 形式 的 问题 ， 然 后 公开 征 
集 解决 方案 ， 最 后 挑选 最 好 的 解决 方案 。 研 究 人 员 甚 至 都 不 需要 知道 
可 以 请 教 的 最 好 的 专家 是 谁 ， 其 实 好 的 想法 有 时 会 来 自 意 想 不 到 的 地 
方 。 


鉴于 我 已 经 对 人 本 计算 项 目 和 公开 征集 项 目 进行 了 介绍 ， 所 以 现 
在 我 可 以 强调 两 者 之 间 的 两 个 重要 区 别 了 。 首 先 ， 在 公开 征集 项 目 
中 ， 研 究 人 员 指 定 的 是 一 个 目标 《例如 预测 电影 评分 ) ， 而 在 人 本 计 
算 项 目 中 ， 研 究 人 员 指 定 的 是 一 个 微 任 务 〈“ 例 如 对 一 个 星系 进行 分 
类 ) 。 其 次 ， 在 公开 征集 项 目 中 ， 研 究 人 员 想 要 的 是 最 好 的 贡献 ， 例 
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有 技术 文献 ， 而 不 是 所 有 页 献 的 简单 集合 。 


我 已 经 描述 了 公开 征集 的 通用 模板 以 及 三 个 示例 ， 那 么 社会 研究 
中 的 哪些 问题 适合 用 该 方法 来 解决 呢 ? 在 这 一 点 上 ， 我 得 承认 成 功 的 
例子 还 不 是 很 多 《我 稍 后 会 解释 原因 ) 。 就 直接 模拟 而 言 ， 我 们 可 以 
设想 一 下 ， 一 位 历史 研究 人 员 通 过 公众 专利 评审 式 的 公开 征集 碍 找 最 
早 提 及 茶 个 特定 的 人 或 想法 的 文件 ， 无 其 是 当 洪 在 的 相关 文件 没有 被 
归档 在 一 起 ， 而 是 广泛 分 散在 各 处 时 ， 公 开征 集 对 这 类 问题 的 价值 就 
ERT. 


普遍 地 讲 ， 许 多 政府 和 公司 都 有 需要 公开 征集 解决 的 问题 ， 因 
为 公开 征集 能 够 产生 预测 算法 ， 而 这 些 预测 可 以 成 为 行动 的 重要 指南 
(Provost and Fawcett 2013; Kleinberg et al. 2015) . flan, 5 
像 网 飞 想 要 预测 电影 评分 一 样 ， 政 府 可 能 想 要 预测 哪 家 餐馆 最 有 可 能 
违犯 卫生 法 规 等 ， 以 便 更 有 效 地 分 配 检查 资源 。 鉴 于 此 ， 爱 德 华 。 格 
Se (Edward Glaeser) 和 同事 便利 用 公开 征集 帮助 波士顿 市 根据 点 
评 网 站 Yelp 上 的 点 评 数 据 和 历史 检查 数据 预测 餐馆 的 卫生 违规 情况 。 
他 们 估计 ， 通 过 公开 征集 所 选 出 的 最 好 的 预测 模型 能 够 将 餐馆 检查 员 
的 工作 效率 提高 约 50%。 


公开 征集 还 可 能 被 用 于 比较 和 测 斌 理论。 例如， 脆弱 家 性 和 儿童 
福利 研究 (Fragile Families and Child Wellbeing Study) 对 在 美 
国 20 个 不 同城 市 出 生 的 约 5000 个 孩子 进行 了 退 踪 (Reichman et al. 
2001) 。 研 究 人 员 分 别 在 孩子 出 生 时 以 及 1 岁 、3 岁 、5 岁 、9 岁 和 15 岁 
时 搜集 了 有 关 这 些 孩 子 、 他 们 的 家 性 以 及 他 们 所 处 的 更 广泛 的 环境 方 
面 的 数据 。 那 么 研究 人 员 利 用 所 有 这 些 数据 预测 谁 将 能 够 大 学 毕业 的 
准确 度 将 如 何 呢 ? 或 者 用 有 些 研 究 人 员 更 加 感 兴趣 的 方式 来 表达 就 
是 ， 哪 些 数据 和 理论 在 预测 这 些 结果 方面 最 有 效 ? 因为 这 些 孩 子 目 前 
都 还 没 到 上 大 学 的 年 龄 ， 所 以 这 将 是 一 个 真正 前 瞻 性 的 预测 ， 而 且 研 
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不 同 。 那 么 哪 种 方法 会 更 有 效 呢 ? 我 们 并 不 知道 ， 在 寻找 答案 的 过 程 
中 ， 我 们 可 能 会 学 到 一 些 有 关 家 庭 、 社 区 、 教 育 和 社会 不 平等 的 重要 
知识 。 此 外 ， 这 些 预 训 也 许 能 被 用 来 指导 以 后 的 数据 采集 。 假 如 有 一 
小 部 分 大 学 毕业 生 在 之 前 各 种 方法 的 预测 中 都 是 不 可 能 大 学 毕业 的 ， 
那么 这 些 人 将 是 后 续 定 性 采访 和 人 种 志 观 察 的 理想 人 选 。 因 此 ， 在 这 
一 类 型 的 公开 征集 中 ， 预 测 并 不 是 目的 ， 相 反 ， 它 们 为 比较 、 拓 展 和 
结合 不 同 的 理论 传统 提供 了 一 种 新 方法 。 这 种 公开 征集 不 只 适用 于 利 
用 脆弱 家 姓 和 儿童 福利 研究 的 数据 来 预测 谁 将 上 大 学 ， 它 还 可 以 预测 
最 终 会 被 搜集 到 纵向 社会 数据 集中 去 的 所 有 结果 。 


正如 我 在 本 小 节 前 面部 分 所 写 的 ， 目 前 还 没有 很 多 社会 研究 人 员 
采用 公开 征集 方法 的 例子 。 我 认为 这 是 因为 公开 征集 的 提问 方式 与 社 
会 科学 家 通常 的 提问 方式 不 太一 样 。 社 会 科学 家 通常 不 会 问 有 关 预 测 
品位 的 问题 ， 相 反 ， 他 们 会 问 不 同 社会 阶层 的 人 的 文化 品位 为 什么 会 
不 同 以 及 是 如 何不 同 的 (参阅 例如 Bourdieu 1987) 。 像 这 种 “如 何 ” 
以 及 “为 什么 ”的 问题 ， 其 解决 方案 通常 都 不 易于 检验 ， 因 此 似乎 不 
适用 于 公开 征集 。 所 以 ， 似 乎 公开 征集 更 适用 于 预测 性 问题 而 不 是 解 
释 性 问题 。 但 最 近 理 论 家 已 经 开始 呼吁 社会 科学 家 重新 考虑 解释 和 预 
测 之 间 的 分 界线 (Watts 2014) 。 随 着 解释 和 预测 之 间 的 界线 越 来 越 
模糊 ， 我 希望 公开 征集 在 社会 研究 中 能 变 得 越 来 越 普遍 。 


6.1 人 简介 


在 之 前 的 章节 中 ， 我 已 经 展示 了 数字 时 代 在 搜集 和 分 析 社 会 资源 
方面 所 创造 的 新 机 过 。 与 此 同时 ， 数 字 时 代 也 带 来 了 新 的 道德 伦理 挑 
战 。 本 章 的 目的 在 于 为 你 们 提供 相应 的 工具 ， 用 以 负责 地 处 理 这 些 道 
德 伦 理 的 挑战 。 


当下 ， 一 些 数字 时 代 社 会 研究 的 道德 伦理 问题 还 存在 着 不 确定 
性 。 这 种 不 确定 性 导致 两 种 相关 问题 产生 ， 其 中 一 个 比 男 一 个 受到 了 
更 多 的 关注 。 一 方面 ， 一 些 研 究 人 员 被 指控 侵犯 了 人 们 的 隐私 权 或 者 
参与 了 不 道德 的 实验 。 我 即将 在 本 章 描述 的 事例 ， 已 经 引起 广泛 争议 
并 成 为 讨论 的 事实 主体 。 另 一 方面 ， 道 德 伦 理 上 的 不 确定 性 也 产生 了 
令 人 不 寒 而 栗 的 结果 ， 这 些 结果 阻碍 了 道德 伦理 以 及 一 些 重要 方面 的 
研究 ， 这 一 事实 我 认为 还 不 太 受 人 重视 。 辟 如， 在 2014 年 埃 博 拉 疫 情 
骏 发 期 间 ， 公 共 卫 生 当 局 硕 望 获取 在 疫情 最 严重 的 相应 国家 的 人 和 群 迁 
移 信息 ， 从 而 帮助 控制 疾病 的 传播 。 移 动 通信 公司 拥有 详细 的 通信 记 
录 ， 并 可 以 从 中 获取 相关 的 信息 。 然 而 ， 道 德 伦理 以 及 法 律 方面 的 担 
忧 使 研究 人 员 分 析 数 据 的 尝试 陷入 困境 (Wesolowski et al. 2014; 
McDonald 2016) 。 如 果 我 们 作为 社 群 的 一 员 ， 能 够 制定 研究 人 员 和 公 
众 共 享 的 道德 伦理 规范 和 标准 〈 这 一 点 我 认为 可 以 做 到 ) ， 那 么 我 们 
就 可 以 用 一 种 对 社会 负 贡 和 有 益 的 方式 来 利用 数字 时 代 赋 了 予 我 们 的 能 
de 


一 个 阻碍 制定 该 共 孚 标准 的 因素 在 于 ， 社 会 科学 家 与 数据 科学 家 
倾向 于 采用 不 同 的 方法 研究 道德 伦理 。 对 社会 科学 家 而 言 ， 道 德 伦理 
的 思考 由 机 构 审查 委员 会 主导 ， 其 任务 在 于 执行 一 系列 的 法 规 。 毕 
竟 ， 对 大 多 数 实证 社会 科学 家 来 说 ， 经 历 道德 伦理 辩论 的 唯一 途径 是 


通过 官僚 机 构 审查 委员 会 的 审查 过 程 。 数 据 科 学 家 对 研究 道德 伦理 问 
题 仅 有 一 些 少量 的 系统 性 经 验 ， 因 为 对 计算 机 科学 与 工程 学 来 说 ， 这 
些 问题 并 不 是 受到 普 过 讨论 的 。 无 论 是 社会 科学 家 在 乎 的 以 规则 为 基 
准 的 方法 ， 还 是 数据 科学 家 在 乎 的 以 特例 假设 为 基准 的 方法 ， 两 者 在 
数字 时 代 对 于 社会 研究 均 不 适用 。 取 而 代 之 ， 我 相信 我 们 作为 社 群 的 
一 员 ， 如 果 能 够 永 取 一 种 基于 原则 的 方法 ， 就 能 取得 进步 。 也 就 是 
说 ， 研 究 人 员 应 该 用 现 有 的 规则 来 评估 他 们 的 研究 “如果 有 的 话 》， 
以 及 用 更 为 普 吉 的 道德 伦理 原则 进行 评 佑 。 这 种 基于 原则 的 方法 能 帮 
助 研究 人 员 在 规则 不 适用 的 情况 下 做 出 理性 的 决定 ， 并 且 帮 助 研究 人 
员 将 他 们 的 推断 传达 给 他 人 和 公众 。 


我 所 提倡 的 这 种 基于 原则 的 方法 并 非 初创 。 它 借鉴 了 数 十 年 前 的 
一 些 想法 ， 其 中 大 部 分 内 容 都 体现 在 两 个 具有 里 程 碑 意 义 的 报告 中 : 
«WOR Stk) «(© Belmont Report) 与 《 门 罗 报 告 》 CMenlo 
Report) 。 你 将 看 到 ， 在 一 些 事例 中 ， 这 种 基于 原则 的 方法 能 引领 我 
们 找到 清晰 有 效 的 解决 方法 。 如 采 不 能 解决 这 些 问题 ， 它 将 前 明 所 涉 
及 的 需要 权衡 的 问题 ， 这 对 于 实现 适当 的 平衡 至 关 重 要 。 此 外 ， 基 于 
原则 的 方法 具有 足够 的 共通 性 ， 无 论 你 们 在 哪里 工作 《〈 比 如 大 学 、 政 
府 机 关 、 非 政府 组 织 或 者 公司 ) ， 它 都 会 有 所 帮助 。 


本 章 旨 在 帮助 善意 的 个 体 研究 人 员 。 对 于 工作 中 所 涉及 的 道德 伦 
理 问 题 ， 你 应 该 怎样 思考 ? 你 应 该 如 何 让 你 的 工作 更 加 符合 道德 伦 
BE? 在 6.2 市 ， 我 将 介绍 三 个 在 数字 时 代 引 起 道德 伦理 争议 的 研究 项 
目 。 接 着 在 6. 3 节 中 ， 我 会 将 这 些 具 体 的 事例 抽象 化 ， 以 此 描述 产生 道 
德 伦 理 不 确定 性 的 一 些 基 本 原因 : 迅速 提高 的 研究 人 员 相关 能 力 ， 使 
得 他 们 在 未 经 参与 者 同意 甚至 在 其 坚 不 知情 的 情况 下 对 人 类 进行 观 家 
与 实验 。 这 种 能 力 的 改变 远 超 我 们 的 规范 、 准 则 与 法 律 的 修订 速度 。 
在 6. 4 节 中 ， 我 将 描述 四 项 既 有 的 原则 ， 以 便于 指导 你 的 思考 方向 : 对 
他 人 的 三 重 原则 、 有 利 化 原则 、 公 正 原则 以 及 对 法 律 和 公共 利益 的 得 
重 原 则 。 接 下 来 ， 在 6. 5 节 中 ， 我 会 总 结 两 种 广泛 的 道德 框架 ， 即 结果 


主义 与 义务 论 ， 它 们 可 以 帮助 你 解决 可 能 面临 的 更 深层 次 的 挑战 : 在 
什么 样 的 时 机 适合 使 用 道德 上 存在 问题 的 手段 来 达到 符合 道德 标准 的 
目的 ?这 些 原则 和 道德 框架 在 图 6. 1 中 得 以 归纳 ， 它 们 将 使 你 超越 对 现 
有 法 规 所 允许 的 范围 的 关注 ， 并 提高 你 与 其 他 研究 人 员 和 公众 沟通 想 
法 的 能 


图 6.1 支配 研究 的 规则 来 源 于 原则 ， 而 原则 相应 地 来 源 于 道德 框架 。 本 章 的 一 个 主 
要 论点 在 于 研究 人 员 应 该 通过 现 有 的 规则 〈 如 果 有 的 话 ) 以 及 更 为 一 般 的 道德 原则 
评估 自己 的 研究 。《 通 则 》 〈 即 《美国 联邦 受 试 者 保护 通则 》 ) 是 目前 支配 美国 大 
部 分 联邦 资助 研究 的 一 系列 规定 (更 多 信息 参见 本 章 的 历史 附录 ) 。 这 四 项 原则 来 
自 《 贝 尔 蒙 报告 》 和 《 门 罗 报 告 》 (更 多 信息 参见 本 章 的 历史 附录 ) 。 最 后 ， 结 果 
主义 与 义务 论 作为 两 种 道德 框架 已 经 在 过 去 的 数 百 年 中 经 过 哲学 家 的 努力 得 以 发 
展 。 有 一 个 简单 而 粗略 的 方法 ， 可 以 用 来 区 分 这 两 种 框架 : 义务 论 专 注 于 过 程 ， 结 
果 主 义 专 注 于 结果 。 

有 了 这 样 的 背景 ， 在 6. 6 节 中 ， 我 将 讨论 对 数字 时 代 的 社会 研究 人 
员 来 说 ， 特 别 共 有 挑战 性 的 四 个 领域 : 知情 同意 〈6. 6. 1 小 节 ) 、 理 解 
与 管理 信息 化 风险 〈6. 6.2 小 节 ) 、 隐 私 权 〈6. 6.3 小 节 ) 以 及 面 对 不 
确定 性 做 出 符合 伦理 规范 的 决策 (6. 6.4 小 节 ) 。 在 6.7 节 ， 我 将 提供 
在 不 稳定 的 伦理 领域 工作 环境 下 的 三 个 实用 技巧 。 本 章 最 后 是 一 个 历 
史 附 录 ， 我 简要 总 结 了 美国 道德 伦理 监督 研究 的 进展 ， 包 括 对 塔 斯 基 
吉 梅 毒 实验 (Tuskegee Syphilis Study) 、《 贝 尔 蒙 报告 》、《 通 
则 》 和 《 门 罗 报告 》 的 讨论 。 


6.2 三 个 事例 


数字 时 代 的 社会 研究 将 涉及 一 些 理性 而 善意 的 人 不 会 同意 的 道德 
伦理 情况 。 


为 了 让 事情 具体 化 ， 我 将 从 三 个 引起 道德 伦理 争议 的 数字 时 代 研 
完 项 目 开始 讲 起 。 我 选择 这 些 特别 的 研究 项 目 主 要 基于 两 个 理由 。 一 
是 关 于 这 些 研究 均 没 有 简单 的 答案 。 也 就 是 说 ， 理 性 而 善意 的 人 们 在 
这 些 研究 是 否 应 该 发 生 以 及 哪些 改变 可 能 改善 这 些 研究 项 目 方面 意见 
人 不一致。 二 是 这 些 研究 体现 了 本 革 后 半 部 分 将 要 讨论 的 许多 原则 、 框 
架 及 其 紧张 关系 。 


6.2.1 情绪 感染 项 目 


70 万 名 脸谱 网 用 户 被 放 入 一 项 实验 中 ， 这 可 能 改变 他 们 的 情绪 。 
这 些 参 与 者 并 没有 同意 参与 ， 该 研究 也 没有 受到 有 意义 的 第 三 方 伦理 
LE 


me 


2012 年 1 月 的 一 周 里 ， 大 约 70 万 名 脸谱 网 用 户 被 安置 进 一 个 名 为 情 
绪 感 染 的 实验 中 ， 即 研究 一 个 人 的 情绪 受到 与 其 互动 的 他 人 情绪 影响 
程度 的 实验 。 我 已 经 在 第 4 章 中 讨论 过 这 个 实验 ， 但 是 我 现在 还 会 再 次 
回顾 它 。 情 绪 感 染 这 项 实验 中 的 参与 者 被 放 入 4 个 组 : “消极 减少 ” 
组 ， 即 在 新 消息 展示 中 对 那些 带 有 消极 词汇 〈 比 如 “悲伤 ”) 的 帖子 
进行 随机 屏蔽 “积极 减少 ”组 ， 即 对 那些 带 有 积极 词汇 〈 比 如 “ 幸 
福 ”) 的 帖子 进行 随机 屏蔽 ;以 及 两 个 对 照 组 ， 一 个 对 应 “积极 减 
少 ” 组 ， 另 一 个 对 应 “消极 减少 ”组 。 研 究 人 员 发 现 ， 与 对 照 组 相 


比 ，“ 积 极 减 少 ” 组 的 人 使 用 的 积极 词汇 略 少 ， 而 消极 词汇 略 多 。 相 
似 地 ， 他 们 也 发 现 届 处 “消极 减少 ”组 的 人 使 用 积极 词汇 稍 多 ， 消 极 
词汇 较 少 。 因 此 ， 研 究 人 员 得 出 了 情绪 感染 的 相应 证 据 〈Kramer， 
Guillory, and Hancock 2014) 。 更 完整 的 实验 设计 和 结果 的 讨论 ， 
请 参见 第 4 章 。 


在 该 论文 通过 《美国 国家 科学 院 院 刊 》 发 表 后 ， 研 究 人 员 和 新 闻 
媒体 对 此 表达 了 强烈 的 抗议 。 围 绕 该 论文 的 争议 主要 集中 在 以 下 两 
A: OO 对 于 超出 脸谱 网 标准 服务 条 款 规则 的 部 分 ， 参 与 者 并 没有 提 
供 任何 的 同意 许可 ; (2) 该 研究 没有 经 过 有 效 的 第 三 方 伦理 审查 
(Grimmelmann 2015) 。 日 渐 激 化 的 争议 中 所 反映 的 道德 伦理 问题 ， 
使 该 期 刊 迅速 针对 此 次 研究 发 表 了 一 篇 罕见 的 关于 道德 伦理 和 伦理 审 
查 过 程 的 社论 〈Verma 2014) 。 在 随后 的 几 年 中 ， 这 项 实验 一 直 广 受 
争议 并 引起 了 激烈 的 讨论 ， 而 对 这 项 实验 的 批评 可 能 会 将 这 类 研究 引 
同 地 下 实验 ， 造 成 意 想 不 到 的 后 果 (Meyer 2014) 。 也 就 是 说 ， 有 些 
人 认为 某 些 公司 并 没有 停止 这 类 实验 ， 只 是 停止 了 在 公众 面前 提 及 它 
们 。 无 论 如何 ， 这 场 争议 可 能 有 助 于 促进 脸谱 网 伦理 研究 审查 流程 的 
创建 (Hernandez and Seetharaman 2016; Jackman and Kanerva 
2016) o 


6.2.2 “3T” MH 


研究 人 员 从 脸谱 网 上 搜 刊 学 生 的 数据 ， 将 其 与 大 学 记录 合并 ,将 
这 些 合并 后 的 数据 用 于 研究 ， 然 后 与 其 他 研究 人 员 共 享 。 


从 2006 年 开始 的 每 一 年 ， 一 个 由 教授 及 其 研究 助理 组 成 的 小 组 都 
在 “美国 东北 部 的 一 所 多 元 化 私立 大 学 ”中 搜刮 学 生 的 脸谱 网 资料 。 
然后 研究 人 员 将 这 些 包 含 了 好 友信 息 与 文化 品位 的 脸谱 网 数据 与 包含 
了 学 术 主 攻 方 向 和 在 校园 内 居住 信息 的 校方 数据 进行 了 合并 。 这 些 合 


并 后 的 数据 是 非常 有 用 的 资源 ， 通 过 这 些 数据 ， 我 们 能 够 对 社交 网 络 
是 如 何 形成 的 《Wimmer and Lewis 2010) 以 及 社交 网 络 与 行为 是 如 何 
共同 演变 的 (Lewis，Gonzalez and Kaufman 2012) 等 主题 产生 新 的 
认识 。 除 了 将 这 些 数 据 用 于 他 们 自己 的 工作 之 外 ，“3T” 项 目 
[Tastes 〈 文 化 品位 ) 、Ties (RR) 、Time (NA) |] 的 研究 人 员 
在 采取 一 些 保护 学 生 隐私 的 措施 后 ， 还 将 这 些 数据 提供 给 了 其 他 研究 
AN (Lewis et al. 2008) 。 


不 垃 的 是 ， 在 提供 这 些 数 据 的 数 日 后 ， 其 他 研究 人 员 就 推断 出 这 
所 学 校 是 哈佛 大 学 (Zimmer 2010) 。 这 个 项 目的 研究 人 员 被 指责 为 
“不 遵守 伦理 研究 标准 ”， 部 分 原因 在 于 学 生 并 未 提供 知情 同意 (所 
有 程序 均 经 过 哈佛 机 构 审查 委员 会 和 脸谱 网 审核 并 批准 ) 。 此 外 还 出 
现 了 来 自学 术 机 构 、 媒 体 的 批评 声 ， 比 如 标题 为 《哈佛 研究 人 员 被 控 
侵犯 学 生 隐 私 权 》 的 纸 媒 报道 (Parry 2011) 。 最 后 ， 这 些 数据 库 被 
从 网 上 移 除 ， 并 且 不 再 能 提供 给 其 他 研究 人 员 使 用 。 


6.2.3 “Encore” MH 


研究 人 员 让 人 们 的 计算 机 秘密 地 去 访问 可 能 被 专制 政府 屏蔽 的 网 


2014 年 3 月 ， 山 姆 。 伯 内 特 (Sam Burnett) 与 尼克 。… 菲 姆 斯 特 
(Nick Feamster) 启动 了 “Encore” (BW “HR” ) 项 目 ， 这 是 一 
个 为 互联 网 审查 提供 实时 和 全 球 测量 的 系统 。 要 做 到 这 一 点 ， 位 于 乔 
治 亚 理 工学 院 的 研究 人 员 辟 励 网 站 所 有 者 将 这 个 小 代码 所 段 放 到 他 们 
网 页 的 源 文件 中 : 


<iframe src="//encore.noise.gatech.edu/task.htm1" 
width="0" height="0" 


style="display: none"></iframe> 


如 果 你 访问 一 个 植 入 此 片段 代码 的 网 站 主页 ， 你 的 网 页 浏览 器 就 
会 答 试 与 网 站 进行 沟通 ， 以 使 研究 人 员 发 现 可 能 的 互联 网 审查 《比如 
观察 你 是 否 访问 了 一 个 被 禁止 的 政治 觉 派 的 网 站 〉， 。 接 着 ， 你 的 网 页 
浏览 器 将 会 反馈 给 研究 人 员 ， 告 诉 他 们 它 是 否 能 够 与 可 能 受到 屏蔽 的 
网 站 进行 沟通 (如 图 6. 2) 。 更 进一步 来 说 ， 所 有 的 步骤 都 不 可 见 ， 除 
非 你 调用 网 页 的 源 文件 进行 检查 。 这 种 隐形 的 第 三 方 页 面 请 求 在 网 络 
上 非常 普遍 (Narayanan and Zevenbergen 2015) ， 但 它们 很 少 涉 
明确 的 对 互联 网 审查 的 测量 。 


这 种 测量 互联 网 审 碍 制度 的 方法 有 一 些 非常 具有 吸引 力 的 技术 特 
性 。 如 果 足 够 多 的 网 站 都 植 入 了 这 样 简单 的 代码 片段 ， 那 么 
“Encore” 项 目 束 能 够 提供 对 被 审查 网 站 的 实时 化 、 全 球 化 测量 结 
果 。 在 局 动 这 个 项 目 之 前 ， 研 究 人 员 与 所 处 机 构 的 机 构 审 查 委 员 会 进 
行 了 交流 ， 而 该 机 构 审查 委员 会 拒绝 审查 该 项 目 ， 因 为 它 不 满足 《 通 
WW) 《更 多 信息 请 参阅 本 章 历 史 附 录 ) 规定 下 的 “人 体 研究 ”条 球 。 


1. 面向 用 户 的 源 服务 页 面包 含 i 
着 测量 任务 


2. 用 户 获 取 页 面 并 执行 测量 任务 


Y 3. 任务 向 测量 目标 上 的 资源 发 出 跨 源 请 求 


用 户 


4. 审查 者 可 能 会 过 滤 请 求 或 做 出 回复 
测量 目标 


图 6.2 “Encore” 项 目的 研究 设计 示意 图 。 在 源 网 站 中 植 入 一 小 段 代码 片段 〈 步 又 
1) 。 你 的 计算 机 加 载 该 网 页 时 ， 随 之 启动 测量 任务 (步骤 2) 。 你 的 计算 机 试图 访 
问 该 测量 目标 ， 也 就 是 访问 受到 屏蔽 的 政党 网 站 【〈( 步 骤 3) 。 政 府 审查 互联 网 的 审查 
者 在 接 下 来 可 能 会 对 你 向 测量 目标 的 访问 进行 屏蔽 (步骤 4) 。 最 终 你 的 计算 机 会 反 
馈 给 研究 人 员 相 应 的 请 求 结 果 (在 图 中 未 显示 ) 。 该 图 片 获 得 计算 机 协会 Burnett 
and Feamster (2015) 文中 图 1 的 转载 许可 。 


然而 ， 在 “Encore” 项 目 局 动 后 不 入 ， 研 究 生 本 。 泽 文 贝 根 (Ben 
Zevenbergen) 联系 了 该 项 目的 研究 人 员 ， 提 出 了 有 关 “Encore” 项 目 
涉及 道德 伦理 的 问题 。 特 别 是 ， 泽 文 贝 根 关注 那些 在 特定 国家 里 利用 
他 们 的 计算 机 尝试 访问 某 些 敏感 网 站 的 人 们 ， 他 们 可 能 会 被 暴露 在 危 
险情 况 之 下 ， 并 且 这 些 人 在 参与 这 个 研究 的 过 程 中 并 不 知情 。 基 于 这 
些 对 话 ，“Encore” 项 目 团队 修改 了 该 项 目的 运营 条 件 ， 试 图 仅 对 脸 
谱 网 、 推 特 以 及 优 兔 进行 测试 ， 因 为 在 正常 的 网 页 浏览 器 中 ， 第 三 方 
试图 访问 这 些 网 站 是 很 常见 的 (Narayanan and Zevenbergen 
2015) « 


在 使 用 这 种 修改 后 的 设计 搜集 数据 后 ， 一 份 描述 其 算法 和 一 些 结 
果 的 论文 被 提交 给 了 一 个 著名 的 计算 机 科学 会 议 ， 即 美国 计算 机 学 会 
数据 通信 专业 组 (SIGCOMM) 。 该 项 目 委 员 会 对 该 文献 的 技术 贡献 表示 
赞赏 ,但 对 其 缺乏 参与 者 知情 同意 表示 担忧 。 随 后 ， 该 项 目 委 员 会 决 


定 发 表 该 论文 ， 但 也 随 之 附 上 一 份 对 道德 伦理 表示 关注 的 声明 
(Burnett and Feamster 2015) 。 这 种 类 似 的 附属 声明 从 未 在 数据 通 
信 专 业 组 会 议 上 被 使 用 过 ， 这 个 事例 引发 了 计算 机 科学 家 对 他 们 的 研 
究 中 有 关 伦 理性 质问 题 的 讨论 (Narayanan and Zevenbergen 2015; 
Jones and Feamster 2015) . 


6.3 数字 时 代 的 不 同 


在 数字 时 代 进 行 的 社会 研究 有 许多 不 同 的 特性 ， 这 些 特性 带 来 了 
不 同 的 道德 伦理 问题 。 


在 模拟 时 代 ， 绝 大 多 数 社 会 研究 的 规模 相对 有 限 ， 它 们 在 一 系列 
合理 而 明确 的 规则 下 运作 。 但 在 数字 时 代 ， 社 会 研究 的 情况 截然 不 
同 。 研 究 人 员 通 常 与 公司 或 政府 部 门 进行 紧密 的 合作 ， 相 比 于 过 去 ， 
他 们 对 测试 参与 者 拥有 了 更 多 的 掌控 力 ， 而 对 这 些 力 量 的 使 用 并 没有 
一 个 明确 的 规则 。 对 于 这 种 能 力 ， 我 将 其 简单 地 视 作 在 未 经 人 们 知情 
同意 甚至 在 其 没有 意识 的 情况 下 进行 研究 活动 的 能 力 。 这 一 系列 的 活 
动 包括 研究 人 员 能 够 在 实验 中 观察 人 们 并 控制 他 们 的 行为 。 随 着 研究 
人 员 观 察 和 王 预 能 力 的 增强 ， 对 如 何 使 用 这 种 能 力 的 清晰 定义 却 并 没 
有 被 相应 界定 。 事 实 上 ， 研 究 人 员 必 须 基 于 一 些 前 后 矛盾 并 相互 重 登 
的 规则 、 法 律 和 规范 来 决定 如 何 行使 这 些 能 力 。 强 大 的 能 力 与 模糊 的 
指导 方针 的 结合 造成 了 当下 困难 的 情况 。 


这 样 一 系列 能 力 中 的 一 项 ， 包 括 研究 人 员 现 在 可 以 未 经 参与 者 知 
情 同 意 或 者 在 他 们 没有 察觉 的 情况 下 观察 参与 者 的 行为 。 研 究 人 员 在 
过 去 当然 也 可 以 这 样 做 ， 但 是 在 数字 时 代 ， 这 种 规模 是 完全 不 同 的 ， 
这 一 事实 已 经 被 许多 大 数据 热衷 者 反复 宣传 过 了 。 特 别 是 ， 如 采 我 们 
从 个 别 学 生 或 教授 的 研究 规模 转移 到 公司 或 者 政府 部 门 层面 上 ， 比 如 
对 与 研究 人 员 合 作 日 益 紧 密 的 机 构 来 说 ， 潜 在 的 伦理 问题 就 变 得 复杂 
起 来 。 我 认为 有 一 个 比喻 可 以 帮助 人 们 全 面 了 解 这 种 大 规模 监视 的 想 
法 ， 那 就 是 全 景 监 狱 (Panopticon) 。 全 景 监 狱 是 最 初 由 杰 里 米 。 边 
沁 (Jeremy Bentham) 针对 监狱 而 提出 的 一 种 建筑 设计 ， 它 是 一 种 圆 
形 建筑 ， 监 舍 是 围绕 着 中 央 卡 望 塔 而 修建 的 《图 6.3) 。 监 狱 管 理 者 能 


A EE A IA EA 
MEAT. HARE AA AUT BIER AE AS LANZA (Foucault 
1995) 。 对 于 一 些 隐私 倡导 者 来 说 ， 数 字 时 代 将 我 们 带 进 了 全 景 监 
狱 ， 因 为 科技 公司 与 政府 部 门 不 断 监 视 并 记录 我 们 的 行为 。 


图 6.3 人 全景 监狱 由 杰 里 米 。 边 并 首次 提出 。 居 中 处 有 一 名 看 不 见 的 观察 者 能 够 监视 

所 有 人 的 行为 ， 却 不 会 被 他 人 察觉 。 上 图 由 威 利 。 雷 瓦尔 利 Willey Reveley) 于 

1791 年 绘制 。 来 源 : CREAR + MHL) (The Works of Jeremy Bentham) 一 
书 。 


由 此 比喻 ， 我 们 发 散 开 来 ， 许 多 社会 研究 人 员 认 为 ， 在 数字 时 
代 ， 他 们 可 以 想象 自己 是 身 处 中 心 上 腑 望 塔 中 的 一 员 ， 观 察 人 们 的 行为 
并 创建 一 个 主 数据 库 ， 进 行 各 种 各 样 让 人 激动 的 重要 研究 。 但 是 现 
在 ， 不 妨 设 想 你 不 再 是 喘 处 中 心 瞬 望 塔 中 ， 而 是 映 处 其 中 一 个 监 舍 之 
中 ， 那 么 这 个 主 数据 库 就 开始 被 视 作 喇 落 数据 库 [由 保罗 。 欧 姆 
(Paul Ohm) 在 2010 年 提出 ] ， 可 以 用 于 不 道德 的 途径 。 


本 书 的 一 些 读者 足够 往 运 ， 能 生活 在 一 个 他 们 信任 其 看 不 见 的 观 
察 者 能 够 负责 任 地 使 用 这 些 数 据 ， 并 且 面 对 敌人 能 够 保护 数据 的 国家 
里 。 另 外 一 些 读 者 却 不 够 幸运 ， 并 且 我 确定 大 规模 监控 所 带 来 的 问题 
对 他 们 来 说 是 非常 明确 的 。 但 是 我 相信 对 那些 幸运 的 读者 来 说 ， 大 规 
模 监 控 仍旧 会 市 来 一 个 非常 值得 关注 的 问题 ， 意料 之 外 的 二 次 使 用 。 
也 束 是 说 ， 一 个 数据 库 是 出 于 某 一 种 目的 而 建造 的 ， 比 如 发 送 定 问 广 
告 ， 但 有 一 天 它 也 可 能 被 用 于 一 种 截然 不 同 的 目的 。 一 个 让 人 毛 骨 悚 
然 的 事例 ， 也 是 意料 之 外 的 二 次 使 用 ， 发 生 在 第 二 次 世界 大 战 期 间 ， 
当时 政府 的 人 口 普 碍 数据 被 用 来 促进 对 犹太 人 、 罗 姆 人 和 其 他 一 些 人 
种 的 种 族 灭 绝 (Seltzer and Anderson 2008) 。 这 些 在 和 平时 期 搜集 
数据 的 统计 学 家 几乎 都 明确 地 拥有 民 好 的 动机 ， 并 且 大 多 数 人 都 相信 
他 们 能 够 负责 任 地 使 用 这 些 数 据 。 但 是 ， 当 世道 改变 的 时 候 ， 纳 粹 党 
获得 权力 ， 这 些 数据 都 出 乎 意料 地 被 二 次 使 用 。 原 因 很 简单 ， 一 旦 存 
在 主 数据 库 ， 就 很 难 意 料 到 谁 可 以 访问 它 ， 以 及 如 何 使 用 它 。 事 实 


Es RB SEOR SE (William Seltzer) 5UX + BPE (Margo 
Anderson) 20084F 1ER 18M AOSTA BY REY RAIL A 
权 的 案件 〈 表 6. 1) 。 更 进一步 来 说 ， 正 如 塞 尔 策 与 安德森 提出 的 ， 这 
份 列表 几乎 可 以 肯定 只 是 保守 估计 ， 因 为 大 多 数 数据 滥用 都 是 秘密 发 
ER. 


普通 的 社会 研究 与 通过 二 次 使 用 侵犯 人 权 的 行为 相去 其 远 。 尽 管 
如 此 ， 我 选择 讨论 这 项 议题 ， 是 因为 我 认为 它 有 助 于 你 们 理解 一 些 人 
可 能 对 你 的 工作 作 何 反应 。 让 我 们 回 到 “3T” 项 目 作为 事例 。 通 过 将 
来 日 脸谱 网 的 完整 精细 的 数据 与 哈佛 大 学 的 完整 精细 的 数据 合并 在 一 
起 ， 研 究 人 员 对 学 生 的 社会 和 文化 生活 形成 了 惊人 的 丰富 观点 (Lewis 
et al. 2008) 。 对 许多 社会 研究 人 员 来 说 ， 这 就 像 是 主 数据 库 ， 可 以 
为 民 好 的 目的 而 服务 。 但 是 对 其 他 一 些 人 来 说 ， 这 也 可 以 让 它 成 为 一 
个 阶 落 数据 库 ， 为 不 道德 的 目的 而 服务 。 事 实 上 ， 可 能 是 两 者 并 存 。 


除了 大 规模 监控 ， 研 究 人 员 通 过 再 次 与 公司 和 政府 部 门 合作 ， 可 
以 越 来 越 多 地 干预 人 们 的 生活 ， 创 建 随机 对 照 实 验 。 比 如 ， 在 情绪 感 
染 项 目 中 ， 研 究 人 员 在 未 取得 知情 同意 且 参 与 者 毫 不 知情 的 情况 下 ， 
在 实验 中 对 70 万 人 进行 了 控制 。 正 如 我 在 第 4 章 所 描述 的 那样 ， 在 这 种 
实验 中 ， 秘 密 被 征用 的 参与 者 并 不 少见 ， 并 且 不 需要 大 公司 的 合作 。 
事实 上 ， 在 第 4 章 中 ， 我 已 经 指出 了 如 何 应 对 这 样 的 情况 。 
表 6.1 人 口 数据 系统 涉及 或 可 能 涉及 侵犯 人 权 的 案例 


地 区 时 间 目标 个 体 或 群体 侵犯 人 权 或 推测 为 国家 意图 
WA | 19 世纪 到 20 tH 
利 亚 | 纪 初 
法 国 |1940—1944 年 | 犹太 人 人 口 登 记 、 特 殊 人 口 普查 强制 迁徙 、 种 族 灭绝 
德国 |1933 一 1945 年 | 犹太 人 、 罗 姆 人 以 及 其 他 人 种 众多 措施 强制 迁徙 、 种 族 灭绝 
和 
和 


原 住民 人 口 登 记 强制 迁徙 、 种 族 灭绝 


匈牙利 | 1945 一 1946 4E | 德国 国籍 以 及 以 德语 为 母语 的 人 群 | 1941 年 人 口 普 查 强制 迁徙 
940 一 1944 4E | 犹太 人 和 罗 姆 人 人 口 登 记 系 统 强制 迁徙 、 种 族 灭绝 
845 一 1930 年 “| 萨 米 人 和 克文 人 人 口 普查 种 族 清洗 
939 一 1944 年 | 犹太 人 特殊 人 口 普 查 和 目的 性 人 口 登记 | 种 族 灭 绝 
939 一 1943 年 | 犹太 人 特殊 人 口 普查 种 族 灭绝 


941—1943 年 | 犹太 人 和 罗 姆 人 1941 年 人 口 普查 强制 迁徙 、 种 族 灭绝 


994 年 图 西 族 人 口 登记 种 族 灭绝 

950 一 1993 年 | 非洲 人 以 及 有 色 人 种 1951 年 人 口 普查 及 人 口 登 记 种 族 隔 离 、 剥 夺 公 民选 举 权 

9 世纪 美洲 原 住民 特殊 人 口 普查 、 人 口 登 记 强制 迁徙 

917 年 涉嫌 违反 法 律 草案 者 1910 年 人 口 普查 对 拒绝 登记 的 人 进行 调查 和 起 诉 
941 一 1945 年 | 日 裔 美国 人 1940 年 人 口 普 查 强制 迁徙 及 拘留 

| 国家 教育 统计 中 心 调查 及 行政 数 


2001—2008 年 | GEMA + 据 国内 和 国际 恐怖 分 子 的 调查 与 起 诉 


2003 年 阿拉 伯 褒 美国 人 2000 年 人 口 普查 未 知 


1919 一 1939 年 | 少数 民族 多 种 人 口 普 查 强制 迁徙 、 其 他 严重 的 惩罚 


注 : 此 表 基 于 塞 尔 策 与 安德森 2008 年 的 报告 所 做 ， 其 中 我 列 了 一 
列子 项 目 。 有 关 每 个 事例 和 纳入 标准 的 更 多 信息 ， 请 参见 Seltzer and 
Anderson (2008) 。 其 中 一 些 事例 涉 及 数据 意料 之 外 的 二 次 使 用 ， 
但 并 非 全 部 如 此 。 


面 对 这 种 日 益 增强 的 能 力 ， 人 研究 人 员 受 制 于 不 统一 和 相互 重 芭 的 
规则 、 法 律 和 规范 。 这 种 不 统一 性 的 一 个 来 源 就 是 数字 时 代 的 能 力 发 
展 远 超过 规则 、 法 律 和 规范 的 修订 速度 。 壁 如 ，《 通 则 》 从 1981 年 以 
来 就 没有 大 幅 修 订 过 ， 并 有 旦 最 近 的 一 项 试图 使 其 更 符合 现代 要 求 的 提 
议 需 要 近 5 年 半 的 时 间 才 能 完成 (Jaschik 2017) 。 另 一 个 不 统一 性 的 
来 源 束 是 ， 围 绕 着 隐私 权 等 抽象 概念 的 规范 仍 在 被 研究 人 员 、 政 策 制 
定 者 和 其 他 积极 分 子 激烈 讨论 。 如 果 在 这 一 领域 的 专家 都 不 能 够 达成 
一 种 统一 意见 ， 那 么 我 们 就 不 应 该 期 望 实证 研究 人 员 或 参与 者 去 做 这 
些 。 第 三 个 ， 也 是 最 后 一 个 不 统一 性 的 来 源 在 于 ， 数 字 时 代 的 研究 与 
其 他 领域 或 环境 的 联系 更 为 紧密 ， 这 导致 一 些 规范 和 规则 存在 潜在 的 
重 登 。 辟 如， 在 情绪 感染 项 目 中 ， 来 自 脸 谱 网 的 数据 科学 家 与 来 自 康 
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服务 条 球 即 可 。 对 康泰 尔 大 学 来 说 ， 规 范 与 规则 就 截然 不 同 :， 几乎 所 
有 的 实验 都 必须 在 康 共 尔 大 学 机 构 审查 委员 会 的 监管 下 开展 。 那 么 ， 
究竟 应 该 采取 什么 样 的 规则 来 指导 情绪 感染 项 目 ， 是 听从 脸谱 网 的 还 
是 康 检 尔 大 学 的 ? 当 这 些 都 不 统一 并 且 与 规则 、 法 律 和 规范 相互 重 受 
时 ， 充 满 秋 意 的 研究 人 员 也 可 能 过 到 麻烦 。 事 实 上 ， 正 因为 这 样 的 不 
统一 性 ， 可 能 没有 一 件 事 是 完全 正确 的 。 


总 的 来 说 ， 这 两 项 特征 ， 即 能 力 的 增强 和 应 该 如 何 使 用 能 力 的 共 
识 的 缺乏 ， 都 意味 看 数字 时 代 的 研究 人 员 将 在 可 预见 的 未 来 面临 道德 
伦理 的 挑 成 。 幸 运 的 是 ， 在 处 理 这 些 挑战 时 ， 并 不 需要 从 头 开始 。 相 
反 ， 研 究 人 员 可 以 从 以 前 制定 的 道德 原则 和 框架 中 吸取 智 臣 。 我 将 在 
下 面 两 节 中 讨论 这 些 主题 。 


6.4 四 项 原则 


研究 人 员 面 对 道德 伦理 不 确定 性 时 ， 可 采取 的 四 项 原则 包括 : 对 
人 的 尊重 原则 、 有 利 化 原则 、 公 正 原 则 、 对 法 律 和 公共 利益 的 尊重 原 
Mo 


数字 时 代 研 究 人 员 所 面 对 的 道德 伦理 挑战 与 以 往 截 然 不 同 。 尽 管 
如 此 ， 研 究 人 员 还 是 可 以 通过 早期 构建 的 伦理 思想 来 应 对 这 些 挑战 。 
特别 是 我 相信 《贝尔 蒙 报 告 》 与 《 门 罗 报告 》 这 两 份 报告 反映 出 的 原 
则 可 以 帮助 研究 人 员 推 新 出 他 们 面临 的 道德 挑战 。 正 如 我 在 本 章 的 历 
史 附 录 中 详细 描述 的 那样 ， 这 两 份 报告 都 是 多 名 专家 组 成 的 小 组 经 过 
多 年 审议 得 出 的 结果 ， 各 种 利益 相关 者 提供 了 许多 参考 要 系 。 


首先 ， 在 1974 年 ， 为 回应 研究 人 员 的 伦理 过 失 CARA AN 
塔 斯 基 吉 梅 毒 实 验 ， 在 这 个 实验 里 ， 近 4 万 名 非洲 窗 美 国 男性 被 研究 人 
员 哄 骗 ， 并 且 在 近 40 年 的 时 间 里 无 法 获得 安全 而 有 效 的 治疗 ) ES 
国会 设立 了 一 个 全 国 委员 会 ， 制 定 涉及 人 体 研 究 的 伦理 准则 。 在 贝尔 
蒙 会 议 中 心 召 开会 议 的 4 年 后 ， 该 委员 会 制定 了 《贝尔 蒙 报告 》， 这 是 
一 份 页 数 不 多 却 分 量 十 足 的 文件 。《 贝 尔 蒙 报告 》 是 《通则 》 的 知识 
基础 ， 而 《通则 》 是 由 机 构 审查 委员 会 强制 执行 的 一 系列 用 以 指导 以 
人 类 为 对 象 的 科学 研究 的 规章 制度 (Porter and Koski 2008) 。 


接 下 来 ， 在 2010 年 ， 为 了 回应 计算 机 安全 领域 研究 人 员 的 伦理 过 
失 ， 以 及 弥补 在 数字 时 代 《 贝 尔 蒙 报告 》 观 点 应 用 的 局 限 性 ， 美 国政 
府 ， 特 别 是 美国 国土 安全 部 ， 设 立 了 一 个 监 带 委员 会 ， 为 涉及 信息 通 
信 技 术 的 研究 制定 了 一 个 指导 性 的 道德 框架 。 这 项 努力 的 结果 就 是 
《 门 罗 报 告 》 (Dittrich, Kenneally, and others 2011) 。 
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员 进 行道 德 伦理 审查 的 原则 : 对 人 的 全 重 原则 、 有 利 化 原则 、 公 正 原 
则 、 对 法 律 和 公共 利益 的 总 重 原则 。 在 实践 中 应 用 这 四 项 原则 并 不 是 
简单 直接 的 ， 人 们 可 能 需要 做 出 很 困难 的 平衡 。 尽 管 如 此 ， 这 些 原则 
仍 有 利于 权衡 利 浆 ， 提 出 研究 设计 方面 的 改进 建议 ， 并 使 研究 人 员 能 
够 癌 役 此 和 公众 解释 缘由 。 


6.4.1 对 人 的 尊重 原则 


对 人 的 尊重 原则 在 于 将 人 视 作 独立 自主 的 个 体 并 且 兽 重 他 们 的 愿 


《贝尔 莹 报告 》 认 为， 对 人 的 草 重 原则 由 两 个 不 同 的 部 分 组 成 : 
C1) 个 体 应 该 被 视 作 独立 目 主 的 ，《〈2) 缺少 独立 上 自主 权 的 个 体 应 该 
有 权 获 得 额外 的 保护 。 独 立 目 主 ， 简 单 来 说 就 是 让 人 们 能 够 自行 掌控 
他 们 上 自己 的 生活 。 换 句 话 说 ， 对 人 的 尊重 原则 建议 研究 人 员 不 应 该 在 
未 获得 同意 的 情况 下 采取 行动 。 重 要 的 是 ， 即 使 研究 人 员 认 为 发 生 的 
事情 是 无 害 的 ， 甚 至 是 有 益 的 ， 也 应 该 苯 守 对 人 的 章 重 原则 。 对 人 的 
尊重 原则 要 求 让 参与 者 产生 做 出 决定 的 想法 ， 而 不 是 由 研究 人 员 来 做 
这 样 的 决定 。 


在 实践 中 ， 对 人 的 尊重 原则 被 解释 为 研究 人 员 应 该 尽 可 能 从 参与 
者 那里 获得 知情 同意 。 知 情 同 意 的 基本 思想 是 ， 应 以 可 理解 的 形式 问 
参与 者 提供 相关 信息 ， 然 后 使 其 自愿 同意 参与 其 中 。 这 些 相 关 信 息 的 
每 一 个 术语 本 号 都 是 大 量 额 外 争议 和 学 问 的 主体 (Manson and 
0’ Neill 2007) ， 我 将 在 6. 6. 1 小 节 中 冰 述 知情 同意 。 


在 本 章 开 头 的 每 个 事例 中 ， 研 究 人 员 对 参与 者 都 采取 了 相应 的 行 
动 ， 在 “3T” 项 目 中 使 用 参与 者 的 数据 ， 在 “Encore” 项 目 中 使 用 他 


们 的 计算 机 对 测量 任务 进行 评 佑 ， 在 情绪 感染 项 目 中 控制 他 们 的 行 
为 ， 这 些 均 没有 获得 或 无 视 了 参与 者 的 知情 同意 。 违 反对 人 的 尊重 原 
则 不 会 自动 使 这 些 研究 在 道德 伦理 方面 遭 到 蔡 止 ， 对 人 的 章 重 原则 仅 
是 四 项 原则 之 一 。 但 是 多 考虑 一 些 章 重 他 人 的 方式 的 确 可 以 在 道德 伦 
理 上 改善 这 些 研 究 。 例 如 ， 研 究 人 员 本 可 以 在 研究 开始 前 或 结束 后 从 
参与 者 处 获得 茶 种 形式 的 知情 同意 。 我 在 6. 6. 1 小 节 中 讨论 知情 同意 
时 ， 会 回顾 这 方面 的 项 目 。 


6.4.2 有 利 化 原则 


有 利 化 原则 在 于 理解 和 改善 研究 中 所 存在 的 风险 /收益 状况 ， 然 后 
判断 研究 是 否 达 到 正确 的 平衡 。 


《贝尔 蒙 报告 》 认 为 ， 尊 特有 利 化 原则 是 研究 人 员 对 参与 者 的 义 
务 ， 它 涉及 两 部 分 : (1) DH, (2) 最 大 程度 保障 有 利 及 最 小 程 
度 造 成 伤害 (如 果 无 法 避免 ) 。《 贝 尔 蒙 报告 》 从 古 希 腊 医 学 家 项 波 
克拉 底 在 传统 医学 伦理 中 的 “不 伤害 ”原则 中 获得 灵感 ， 并 且 以 一 种 
强 有 力 的 形式 表达 出 研究 人 员 “ 不 应 该 伤害 一 个 人 人， 不管 这 可 能 会 给 
别人 带 来 什么 好 处 ” (Belmont Report 1979) 。 尽 管 如 此 ，《 贝 尔 蒙 
报告 》 也 承认 ， 理 解 这 可 能 给 别人 带 来 什么 好 处 的 过 程 本 映 也 许 会 让 
某 些 人 暴露 在 风险 中 。 因 此 ， 不 伤害 的 必要 性 可 能 与 理解 过 程 的 必要 
性 相 冲 突 ， 导 致 研究 人 员 偶 尔 要 做 出 艰难 的 决定 : “在 涉及 风险 的 情 
况 下 ， 何 时 我 们 可 以 理所当然 地 寻求 某 些 利益 ， 何 时 因 风 险 的 存在 我 
们 应 该 放弃 相关 利益 ? ” 


在 实践 中 ， 有 利 化 原则 被 解释 为 研究 人 员 应 该 实施 两 个 不 同 的 步 
R: 风险 /收益 分 析 ， 以 及 随后 判定 风险 和 收益 是 人 否 达到 适当 的 道德 伦 
理 平 衡 。 第 一 个 过 程 主要 涉及 实质 性 专业 知识 的 技术 问题 ， 而 第 二 个 


过 程 主要 是 伦理 问题 ， 在 第 二 个 过 程 里 ， 实 质 性 专业 知识 可 能 不 那么 
有 价值 ， 甚 至 是 有 害 的 。 


风险 /收益 分 析 包 合理 解 与 改善 研究 中 的 风险 与 收益 。 对 风险 的 分 
析 应 该 包括 两 个 要 素 : 不 恨 事件 发 生 的 概率 以 及 这 些 事 件 的 严重 程 
度 。 作 为 风险 /收益 分 析 的 结果 ， 一 名 研究 人 员 可 以 调整 研究 的 设计 方 
案 ， 以 降低 不 良 事件 发 生 的 概率 《比如 排除 心理 脆弱 的 参与 者 ) ， 或 
者 在 其 发 生 后 减轻 事件 的 严重 程度 (比如 向 有 需求 的 参与 者 提供 咨询 
服务 ) 。 再 者 ， 在 风险 /收益 分 析 的 过 程 中 ， 研 究 人 员 需 要 明确 ， 他 们 
的 研究 所 产生 的 影响 不 仅 限 于 参与 者 ， 也 包括 非 参 与 者 和 社会 公众。 
璧 如， 请 想 想 雷 斯 蒂 沃 与 范 德 里 杰 特 关于 奖励 对 维基 百科 编辑 的 影响 
实验 〈 在 第 4 章 讨 论 过 ) 。 在 这 个 实验 中 ， 研 究 人 员 对 一 小 部 分 他 们 认 
为 有 价值 的 编辑 给 予 一 些 奖 励 ， 然 后 退 踪 这 些 人 之 后 对 维基 百科 的 页 
献 ， 与 之 对 照 的 是 妨 一 部 分 同样 值得 奖励 的 编辑 ， 但 研究 人 员 没 有 给 
予 奖励 。 试 想 一 下 ， 如 果 不 是 仅 对 一 小 部 分 人 提供 奖励 ， 而 是 对 维基 
百科 的 编辑 均 提 供 非 常 多 的 奖励 会 是 什么 样 的 ? 尽管 这 样 的 设计 并 不 
会 伤害 任何 一 位 参与 者 ， 但 是 它 可 能 破坏 整个 维基 百科 的 系统 奖励 机 
制 。 换 句 话 说 ， 妆 进行 风险 / 收 荔 分 析 时 ， 你 不 仅 应 该 思考 你 的 工作 对 
参与 者 的 影响 ， 而 且 应 该 把 整个 世界 都 更 多 地 考虑 进来 。 


接 下 来 ， 一旦 风险 被 最 小 化 ， 利 荔 被 最 大 化 后 ， 研 究 人 员 就 应 该 
评估 研究 是 否 能 够 带 来 一 个 良好 的 平衡 。 伦 理学 家 并 不 建议 单纯 地 计 
算 成 本 与 收益 。 特 别 是 ， 茶 些 风险 会 致使 研究 不 被 允许 做 实验 ， 无 论 
其 收益 有 多 高 〈 比 如 在 历史 附录 中 涉及 的 塔 斯 基 高 梅毒 实验 ) 。 与 技 
术 性 的 风险 /收益 分 析 不 同 ， 第 二 个 步骤 需要 非常 符合 道德 标准 ， 事 实 
上 可 以 由 没有 特定 专业 领域 和 专业 知识 的 人 来 实施 。 事 实 上 ， 局 外 人 
往往 相 较 于 局 内 人 更 能 够 注意 到 各 种 不 同事 件 ， 这 就 是 在 美国 的 机 构 
审查 委员 会 中 全 少 需要 一 位 非 研究 人 员 参 与 的 原因 。 在 我 服务 机 构 审 
碍 委员 会 的 经 历 中 ， 这 些 局 外 人 能 帮助 我 们 防止 从 众 思考 。 因 此 ， 如 
果 你 在 研究 项 目 中 对 是 否 适 当 进 行 了 风险 /收益 分 析 感 到 疑惑 ， 那 么 别 


去 询问 你 的 同事 ， 试 着 去 请 教 一 下 非 研究 人 员 的 意见 ， 他 们 的 答案 可 
能 会 让 你 感到 意外 。 


在 我 们 分 析 的 三 个 事例 中 ， 应 用 有 利 化 原则 可 能 会 改善 其 风险 / 收 
葵 的 平衡 。 辟 如， 在 情绪 感染 项 目 中 ， 研 究 人 员 本 可 以 尝试 排除 18 周 
岁 以 下 的 用 户 以 及 对 这 项 措施 反应 特别 过 激 的 用 户 。 他 们 本 可 以 通过 
一 些 有 效 的 统计 学 方法 尽量 减少 参与 者 的 人 数 〈 具 体 细节 在 第 4 章 中 已 
经 讨论 到 ) 。 再 者 ， 他 们 本 可 以 试图 监控 参与 者 ， 并 向 似乎 受到 伤害 
的 人 提供 帮助 。 在 “3T” 项 目 中 ， 研 究 人 员 本 可 以 在 他 们 公开 数据 时 
附带 特别 保护 措施 《尽管 他 们 的 程序 得 到 了 哈佛 机 构 审查 委员 会 的 批 
准 ， 而 这 一 批准 表明 在 当时 这 样 做 是 符合 常规 做 法 的 ) ; 我 在 6. 6. 2 小 
节 中 描述 信息 化 风险 时 ， 会 提供 一 些 更 详细 的 有 关 数 据 公 开 的 建议 。 
最 后 ， 在 “Encore” 项 目 中 ,研究 人 员 本 可 以 尽量 减少 为 实现 测量 目 
标 而 创建 的 风险 请 求 的 数量 ， 并 且 他 们 本 可 以 排除 受到 专制 政府 威胁 
最 大 的 参与 者 。 每 一 项 可 能 的 改变 均 需 要 这 些 项 目的 设计 做 出 一 些 取 
舍 ， 我 的 目的 不 在 于 建议 研究 人 员 做 出 这 些 改 变 ， 而 在 于 更 多 地 展示 
有 利 化 原则 能 够 带 来 的 改变 。 


最 后 ， 虽 然 数 字 时 代 通 名 使 风险 和 收益 的 平衡 更 加 复杂 ， 但 它 也 
使 研究 人 员 更 容易 增加 其 工作 的 收益 。 特 别 是 ， 数 字 时 代 的 工具 极 大 
地 促进 了 开放 和 可 重复 研究 ， 研 究 人 员 可 以 将 他 们 的 研究 数据 和 代码 
提供 给 其 他 研究 人 员 ， 并 通过 公开 发 表 癌 公众 提供 他 们 的 论文 结 
开放 和 可 重复 研究 的 这 种 趋势 绝 非 简单 的 变化 ， 它 为 研究 人 员 提 供 了 
一 种 增加 研究 收益 的 途径 ， 而 不 会 使 参与 者 面临 任何 额外 的 风险 〈 数 
据 共享 是 一 个 例外 情况 ， 我 将 在 6. 6. 2 小 节 中 详细 讨论 信息 化 风险 ) 。 


6.4.3 公正 原则 


公正 原则 是 确保 研究 的 风险 和 收益 能 够 被 公平 地 分 配 。 
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益 。 即 在 社会 环境 中 不 应 该 仅 由 某 一 个 小 组 承担 研究 成 本 ， 而 另 一 个 
小 组 获得 其 产生 的 全 部 利益 ， 壁 如 ，19 世 纪 到 20 世 纪 初 ， 在 医学 实验 
中 担任 研究 对 象 的 负担 主要 落 在 穷人 身上 ， 而 因此 获得 更 好 的 医疗 保 
健 的 好 处 则 主要 流向 了 富 人 。 


在 实践 中 ， 公 正 原 则 最 初 被 解释 为 弱势 群体 应 该 被 保护 ， 免 受 研 
究 人 员 的 伤害 。 换 句 话 说， 研究 人 员 不 应 该 被 允许 故意 地 侵犯 弱势 群 
体 。 令 人 不 安 的 是 ， 在 过 去 ， 大 量 存在 道德 伦理 问题 的 研究 通常 都 会 
涉及 弱势 群体 ， 包 括 缺 乏 教育 的 和 被 被 夺 公 权 的 公民 (Jones 
1993) , WE (Spitz 2005) 以 及 住院 的 老 弱 患者 (Arras 2008) 。 


尽管 如 此 ， 大 约 在 1990 年 ， 对 公正 的 看 法 开始 从 保护 转 问 接受 
(Mastroinanni and Kahn 2001) 。 辟 如， 积极 分 子 认为 ， 儿 童 、 妇 
女 和 少数 民族 需要 明确 纳入 临床 试验 之 中 ， 以 便 这 些 群 体 可 以 从 临床 
试验 获得 的 知识 中 受益 (Epstein 2009) 。 


除了 关于 保护 与 接受 的 问题 之 外 ， 公 正 原则 还 经 常 引发 对 参与 者 
的 适当 补偿 的 问题 ， 这 也 是 在 医学 伦理 方面 存在 激烈 争议 的 问题 
(Dickert and Grady 2008) 。 


把 公正 原则 应 用 到 我 们 的 三 个 事例 中 ， 这 为 我 们 提供 了 不 同 的 方 
式 去 审视 它们 。 这 些 研究 中 没有 任何 一 个 同 参与 者 提供 了 经 济 补偿 。 
“Encore” 项 目 引 起 了 最 为 复杂 的 公正 原则 问题 。 尽 管 有 利 化 原则 可 
能 建议 排除 来 自 专 制 政府 国家 的 参与 者 ， 但 公正 原则 可 能 主张 让 这 些 
人 参与 进来 并 从 中 获 益 ， 以 此 来 准确 测量 互联 网 审查 制度 。“3T” 项 
目 也 引发 了 争议 ， 因 为 仅 有 一 组 学 生 承 担 了 研究 的 负担 ， 而 整个 社会 
从 中 受益 。 最 后 ， 在 情绪 感染 项 目 中 ， 承 担 研 究 负担 的 参与 者 是 最 可 
能 从 结果 中 受益 的 人 口 随 机 样本 〈 即 脸谱 网 用 户 ) 。 从 这 个 意义 讲 ， 
情绪 感染 项 目的 设计 与 公正 原则 是 非常 一 致 的 。 


6.4.4 HABRIA EN SEN 


对 法 律 和 公共 利益 的 尊重 原则 ， 将 有 利 化 原则 从 具体 的 研究 参与 
者 延伸 到 了 整个 利益 相关 者 群体 。 


第 4 个 也 是 最 后 一 个 指导 我 们 思考 的 原则 就 是 对 法 律 和 公共 利益 的 
尊重 原则 。 这 项 原则 来 源 于 《 门 罗 报告 》， 因 此 并 不 为 广大 社会 研 完 
人 员 所 知 。《 门 罗 报 告 》 认 为 ， 对 法 律 和 公共 利益 的 草 重 原则 隐 含 在 
有 利 化 原则 之 中 ， 但 它 也 认为 前 者 值得 被 明确 考虑 。 特 别 是 ， 当 有 利 
化 原则 趋 于 关注 参与 者 时 ， 对 法 律 和 公共 利益 的 得 重 原则 明确 或 励 研 
完 人 员 应 该 有 更 为 广阔 的 想法 和 法 律 方面 的 考量 。 


在 《 门 罗 报 告 》 中 ， 对 法 律 和 公共 利益 的 草 重 原则 包含 两 个 明确 
的 部 分 : (1) 合 规 性 ， (2) 基于 透明 的 问 贡 制 。 合 规 性 意味 着 研究 
人 员 应 该 尝试 识别 并 遵守 相关 法 律 、 合 同和 服务 条 球 。 例 如 ， 合 规 性 
意味 着 ， 想 要 获取 网 站 内 容 的 研究 人 员 应 该 阅读 并 考虑 该 网 站 的 服务 
条 球 协 议 。 尺 管 如 此 ， 也 有 可 能 存在 违反 服务 条 球 的 情况 ， 请 记 住 ， 
对 法 律 和 公共 利益 的 尊重 原则 仪 是 四 项 基本 原则 之 一 。 壁 如 ， 威 瑞 森 
电信 (Verizon) 与 AT&T (美国 电话 电报 公司 ) 曾 一 度 有 服务 条 球 阻 止 
客户 对 其 进行 批评 (Vaccaro et al. 2015) 。 我 认为 研究 人 员 应 该 遵 
从 服务 条 款 。 在 理想 情况 下 ， 如 果 研 究 人 员 违 背 了 服务 条 款 协议 ， 那 
么 他 们 应 该 公开 解释 这 样 做 的 理由 (参见 Soeller et al. 2016) ， 正 
如 基于 透明 的 问 责 制 所 建议 的 那样 。 但 是 这 样 的 公开 化 可 能 将 研究 人 
员 烘 露 在 附加 的 法 律 风 险 下 ， 辟 如， 美国 《计算 机 欺诈 和 滥用 法 》 
(CFAA》 可 能 将 违反 服务 条 球 定 义 为 非法 (Sandvig and Karahalios 
2016; Krafft, Macy, and Pentland 2016) 。 这 个 简短 的 讨论 表明 ， 
伦理 审议 中 的 合 规 性 可 能 引发 更 为 复杂 的 问题 。 


除了 合 规 性 以 外 ， 对 法 律 和 公共 利益 的 章 重 原则 也 豆 励 基于 透明 
的 问 责 制 ， 这 意味 着 研究 人 员 应 该 对 各 阶段 的 研究 目标 、 方 法 以 及 结 
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责 制 试图 蔡 止 研究 团体 的 秘密 行为 。 这 种 基于 透明 的 问 责 制 使 公众 在 
道德 伦理 争议 中 发 挥 了 更 广泛 的 作用 ， 这 对 伦理 和 实践 两 方面 都 很 重 


要 。 


将 对 法 律 和 公共 利益 的 尊重 原则 应 用 于 这 里 所 考虑 的 三 项 研究 
中 ， 可 以 说 明 研 究 人 员 在 涉及 法 律 时 所 面临 的 问题 的 复杂 性 。 壁 如 ， 
格林 默 曼 指出 情绪 感染 项 目 在 马里 兰州 可 能 是 非法 的 (Grimmelmann 
2015) 。 特 别 是 在 2002 年 马里 兰州 议会 通过 了 917 法 案 (Maryland 
House Bill 917), 将 《通则 》 保 护 拓展 到 在 马里 兰州 进行 的 所 有 研 
究 ， 并 且 这 种 保护 与 研究 的 资金 来 源 无 和 关 《〈 很 多 专家 认为 情绪 感染 项 
目的 主体 并 不 是 属于 联邦 法 律 《通则 》 下 的 主体 ， 因 为 该 项 目 由 脸谱 
网 发 起 ， 而 该 机 构 并 不 受到 美国 政府 的 研究 资助 ) 。 尽 管 如 此 ， 一 些 
学 者 认为 马里 兰州 917 法 案 本 映 也 属 违宪 (Grimmelmann 2015, 
pp. 237-238) 。 社 会 研究 人 员 并 非法 官 ， 因 此 他 们 也 不 必 理 解 或 评估 
全 美国 50 个 联邦 州 的 法 律 是 否 符合 宪法 。 在 国际 项 目 中 ， 这 样 的 复杂 
性 变 得 更 加 严重 。 壁 如 “Encore” 项 目 涉 及 170 个 国家 的 参与 者 ， 要 从 
合 规 性 的 角度 考虑 是 异常 困难 的 。 为 了 回应 模糊 的 合法 环境 ， 研 究 人 
员 可 能 通过 第 三 方 监管 其 工作 来 获 益 ， 以 防 研究 中 的 无 意 违法 ， 第 三 
方 既 是 法 律 要 求 的 建议 来 源 ， 也 是 对 个 人 的 保护 。 


另 一 方面 ， 这 三 项 研究 均 将 其 结果 发 表 于 学 术 期 刊 ， 以 实现 基于 
透明 的 问 贡 制 。 事实 上 ， 情 绪 感 染 项 目的 结果 以 公开 的 形式 发 表 ， 所 
以 研究 机 构 或 者 社会 大 众 能 够 获知 其 设计 方案 和 研究 结果 。 一 个 简单 
而 粗略 的 用 来 评估 基于 透明 的 问 员 制 的 方法 是 询问 你 自己 当 我 的 研 
完 过 程 在 我 家 乡 的 报纸 尖 版 上 被 提 及 时 ， 我 是 否 感 到 心安 ?如 果 管 案 
是 否定 的 ， 那 么 就 说 明 你 的 研究 设计 可 能 需要 做 出 调整 。 


总 而 言 之 ，《 贝 尔 蒙 报 告 》 和 《 门 罗 报告 》 提 出 了 四 项 可 用 于 评 
佑 科学 研究 的 原则 ， 对 人 的 尊重 原则 、 有 利 化 原则 、 公 正 原则 以 及 对 


法 律 和 公共 利益 的 草 重 原则 。 应 用 这 四 项 原则 在 实践 中 并 不 是 简单 直 
白 的 ， 它 可 能 需要 更 为 复杂 的 权衡 。 艾 如 ， 在 决定 是 人 否 癌 情 绪 感 染 项 
目的 参与 者 汇报 该 项 目的 情况 时 ， 对 人 的 章 重 原则 惑 会 残 励 研究 人 员 
告知 ， 但 是 有 利 化 原则 惑 不 会 或 励 这 样 做 〈 如 果 汇 报 本 吴 可 能 造成 伤 
害 的 话 ) 。 并 不 存在 一 种 自动 的 方式 可 以 权衡 相互 冲突 的 原则 ， 但 是 
这 四 项 原则 帮助 我 们 理解 了 如 何 做 出 取舍 ， 对 研究 设计 方案 的 调整 给 
出 了 建议 ， 还 能 让 研究 人 员 对 他 人 和 社会 公众 解释 其 缘由 。 


6.5 两 种 道德 框架 


大 多 数 关于 实验 研究 的 道德 伦理 的 争议 都 会 减少 结果 主义 与 义务 
论 之 间 的 分 歧 。 


对 人 的 草 重 原则 、 有 利 化 原则 、 公 正 原则 以 及 对 法 律 和 公共 利益 
的 草 重 原则 这 四 项 原则 本 身 来 产 于 更 为 抽象 的 两 种 这 德 框 以 ; 结果 主 
义 与 义务 论 。 理 解 这 两 种 框 絮 有 所 神 蔓 ， 因 为 它们 将 可 以 让 你 识别 并 
推断 出 伦理 研究 中 最 根本 的 紧张 关系 之 一 : 使 用 潜在 的 不 道德 手段 达 
到 道德 目的 。 
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Mill) 的 思想 ， 关 注 于 采取 相关 行动 使 世界 上 的 国家 变 得 更 好 
(Sinnott-Armstrong 2014) 。 有 利 化 原则 时 在 权衡 风险 和 利益 ， 是 
结果 主义 者 更 为 深层 次 的 思考 来 源 。 义 务 论 来 源 于 康德 的 思想 ， 关 注 
于 道德 义务 ， 它 与 其 所 收 到 的 结果 无 关 (Alexander and Moore 
2015) 。 对 人 的 章 重 原则 重视 参与 者 的 自主 权利 ， 它 是 一 种 道德 义务 
的 深层 思考 来 源 。 一 个 简单 而 粗略 的 用 以 区 分 这 两 种 框架 的 方法 是 : 
道德 义务 论 者 关心 过 程 ， 而 结果 主义 者 关心 结果 。 


要 了 解 这 两 种 框架 如 何 运作 ， 可 以 参考 知情 同意 。 这 两 个 框架 均 
能 用 以 支持 知情 同意 ， 但 是 有 不 同 的 理由 。 结 果 主 义 者 的 论证 观 后 在 
于 ， 对 于 茶 止 那些 不 能 准确 权衡 风险 与 预期 利益 的 研究 ， 知 情 同 意 能 
保护 参与 者 免 受伤 害 。 换 言 之， 结果 主义 者 认为 支持 知情 同意 能 帮助 
参与 者 免 受 不 展 结果 的 影响 。 尽 管 如 此 ， 对 义务 论 者 来 说 ， 其 论证 观 
点 在 于 ， 知 情 同意 关注 研究 人 员 有 义务 草 重 参与 者 的 自主 决定 。 基 于 


这 些 方法 ， 纯 粹 的 结果 主义 者 可 能 愿意 在 没有 风险 的 情况 下 放弃 获得 
知情 同意 的 要 求 ， 而 纯粹 的 道德 义务 论 者 可 能 不 会 。 


结果 主义 和 义务 论 都 提供 了 重要 的 道德 洞察 力 ， 但 每 个 都 可 以 被 
视 为 欧 请 的 极端 。 对 于 结果 主义 ， 其 中 一 个 极端 例子 是 移植 。 试 想 一 
个 医生 有 5 名 因 器 官 衰 竭 而 濒临 死亡 的 病 患 ， 而 另外 一 个 人 的 器 官 可 以 
拯救 这 5 个 人 。 在 确定 的 条 件 下 ， 一 名 结果 主义 的 医生 会 允许 甚至 要 求 
杀 死 那 位 健康 的 人 去 获取 他 的 器 官 。 他 完全 只 看 结果 ， 并 不 考虑 过 
程 ， 这 是 有 缺陷 的 。 


同 理 ， 义 务 论 也 一 样 拥 有 殉 唐 的 极端 ， 例 如 一 个 关于 定时 炸弹 的 
例子 。 试 想 一 个 警察 抓 捕 到 一 名 恐怖 分 子 ， 仅 怖 分 子 知道 一 枚 能 危及 
数 百 万 人 生命 的 定时 炸弹 的 位 置 。 一 个 信奉 义务 论 的 警察 可 能 不 会 通 
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不 考虑 结果 ， 也 一 样 是 有 缺陷 的 。 


在 实践 中 ， 大 多 数 社会 研究 人 员 含 更 地 融合 了 这 两 种 道德 框架 。 
我 们 注意 到 ， 这 两 种 道德 框 染 的 融合 可 以 帮助 我 们 理解 为 什么 存在 如 
此 多 的 伦理 和 争议， 因为 某 些 人 更 趋 近 于 结果 主义 者 而 力 一 些 人 更 趋 近 
于 义务 论 者 ， 且 双方 无 法 取得 更 多 的 进展 。 结 果 主 义 者 往往 提出 有 关 
结果 的 论点 ， 而 这 样 的 论点 并 不 修 义 务 论 者 所 接受 ， 他 们 更 忧心 于 过 
程 。 同 理 ， 义 务 论 者 倾向 于 提供 有 关 过 程 的 论点 ， 而 这 也 不 被 结果 主 
义 者 所 接受 ， 他 们 更 关注 结果 。 结 果 主 义 者 与 义务 论 者 就 此 渐 行 渐 
远 。 


这 种 争议 的 一 个 解决 方案 是 让 社会 研究 人 员 发 展 出 一 种 一 致 的 、 
道德 坚实 的 、 易 于 操作 的 结果 主义 与 义务 论 的 融合 体 。 很 遗憾 ， 这 不 
太 可 能 发 生 ， 哲 学 家 已 经 被 这 个 问题 困扰 了 很 长 一 段 时 间 。 尽 管 如 
此 ， 研 究 人 员 仍 旧 能 够 使 用 这 两 种 框 染 以 及 四 项 原则 ， 为 道德 伦理 挑 
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6.6 困难 面 


四 项 原则 ， 即 对 人 的 章 重 原则 、 有 利 化 原则 、 公 正 原则 以 及 对 法 
律 和 公共 利益 的 全 重 原则 ; 两 种 道德 框架 ， 即 结果 主义 与 义务 论 ， 这 
些 应 该 能 帮助 你 厘清 任何 研究 中 所 面临 的 道德 伦理 问题 。 尽 管 如 此 ， 
基于 在 本 章 之 前 描述 的 数字 时 代 研 究 特性 以 及 我 们 运 今 已 考虑 到 的 伦 
理 争 议 ， 我 认为 存在 四 个 特定 的 困难 面 : 知情 同意 、 理 解 与 管理 信息 
化 风险 、 隐 私 权 以 及 面 对 不 确定 性 所 做 出 的 决策 。 在 接 下 来 的 几 个 小 
节 中 ， 我 将 揪 述 这 四 项 要 操 的 上 其 体内 容 并 提供 如 何 处 理 它们 的 一 些 建 
议 。 


6.6.1 知情 同意 


研究 人 员 应 该 、 可 以 并 且 需 要 遵循 如 下 规则 : 在 大 多 数 研究 中 获 
得 茶 种 形式 的 同意 。 


知情 同意 是 研究 道德 伦理 方面 的 一 个 基本 想法 ， 有 些 人 可 能 说 这 
是 一 种 近乎 强迫 的 想法 (Emanuiel, Wendler, and Grady 2000; 
Manson and 0’ Neill 2007) 。 最 简单 的 伦理 研究 要 求 : 所 有 事情 都 
需要 知情 同意 。 尽 管 如 此 ， 这 个 简单 的 规则 对 于 既 有 的 道德 原则 、 道 
德 规则 或 是 研究 方法 都 不 一 致 。 取 而 代 之 ， 研 究 人 员 应 该 、 可 以 并 且 
需要 遵循 更 为 复杂 的 规则 : 在 大 多 数 研究 中 获得 某 种 形式 的 同意 。 


首先 ， 为 了 跳出 关于 知情 同意 的 过 分 简单 化 的 想法 ， 我 想 告诉 你 
更 多 关于 研究 收视 的 实地 调查 。 在 这 些 研 究 中 ， 虚 假 申 请 人 具有 不 同 
的 特征 ， 比 如 一 些 男 性 和 一 些 女性 申请 不 同 的 工作 。 如 果 其 中 一 类 申 


请 者 更 频繁 地 受 雇 ， 那 么 研究 人 员 可 以 归纳 认为 雇佣 过 程 中 可 能 存在 
歧视 。 对 于 本 章 的 目的 来 说， 实验 最 重要 的 事情 在 于 参与 者 ， 即 雇 
主 ， 在 实验 的 过 程 中 从 没有 同意 参与 实验 。 事 实 上 ， 这 些 参与 者 都 被 
积极 地 欺 驴 了。 然而， 在 17 个 国家 进行 的 这 种 研究 歧视 的 实地 调查 有 
117 项 之 多 (Riach and Rich 2002; Rich 2014) 。 


采用 实地 调查 研究 歧视 的 研究 人 员 已 经 确定 了 这 些 研究 的 四 项 特 
征 ， 总 体 而 言 ， 使 其 符合 道德 标准 : (1) 对 雇主 有 限 的 伤害 ; (2) 
拥有 可 靠 的 歧视 衡量 措施 ， 进 而 可 获取 巨大 的 社会 效益 ; ID HER 
视 的 其 他 方法 有 其 自身 弱点 ; (4) 欺骗 行为 并 没有 严重 违反 规定 的 形 
式 (Riach and Rich 2004) 。 其 中 每 一 项 条 件 都 是 关键 的 ， 一 旦 其 中 
一 条 不 被 满足 ， 那 么 这 个 伦理 事例 将 面临 更 多 挑战 。 其 中 三 项 特征 来 
源 于 《贝尔 蒙 报告 》 涉 及 的 道德 原则 : 有 限 伤害 〈 对 人 的 尊重 原则 、 
有 利 化 原则 ) ， 获 取 最 大 利益 ， 相 较 而 言 其 他 方法 有 其 不 足 〈 有 利 化 
原则 、 公 正 原 则 ) 。 最 后 一 项 特征 ， 遵 守 相 关 规 则 ， 则 来 源 于 《 门 罗 
报告 》 中 提 及 的 对 法 律 和 公共 利益 的 尊重 原则 。 换 言 之 ， 就 业 申 请 其 
本 身 是 一 个 已 存在 一 些 可 预期 欺骗 的 环境 。 因此， 这 些 实验 并 不 会 侵 
犯 既 有 的 原始 道德 观 。 


除了 这 种 基于 原则 的 论点 之 外 ， 多 数 机 构 审 碍 委员 会 认为 ， 这 些 
研究 虽然 缺乏 知情 同意 ， 但 与 现 有 规则 还 是 相 一 致 的 ， 特 别 是 与 《 通 
则 》 第 46 间 116 条 a 部 分 中 所 描述 的 相 一 致 。 最 后 ， 美 国法 院 也 支持 在 
实地 调查 中 缺乏 同意 和 使 用 坎 驴 来 衡量 上 蚊 视 的 行为 《No.， 81-3029. 
United States Court of Appeals, Seventh Circuit) 。 因 此 ， 在 未 
经 同意 的 情况 下 进行 实地 调 碍 符合 既 有 的 道德 原则 与 规则 《至 少 符合 
在 美国 的 规则 ) 。 这 个 理由 被 广大 社会 研究 团体 、 多 数 机 构 审 碍 委员 
会 以 及 美国 上 诉 法 院 所 文 持 。 所 以 ， 我 们 必须 放 和 痉 “ 所 有 事情 都 需要 
知情 同意 ”这 一 简单 规则 。 这 不 是 研究 人 员 必 须 遵 循 的 规则 ， 也 不 是 
他 们 应 该 遵循 的 规则 。 


跳出 “所 有 事情 都 需要 知情 同意 ”这 一 框架 ， 研 究 人 员 面 临 着 一 
个 环 手 的 问题 : 对 于 不 同 种 类 的 研究 ， 究 竟 需 要 何 种 形式 的 同意 ? A 
然 ， 围 经 这 个 问题 一 直 存 在 很 大 的 和 争议， 尽管 其 中 大 部 分 讨论 都 是 在 
模拟 时 代 的 医学 研究 背景 下 进行 的 。 尼 尔 。 埃 亚 勒 (Nir Eyal) € 
2012 年 将 这 些 争 论 总 结 为 : 


干预 的 风险 越 大 ， 越 是 能 影响 或 定义 “关键 的 生活 选择 ”; 干预 
的 价值 载重 和 争议 性 越 大 ， 干预 直接 影响 的 身体 领域 就 拥有 越 多 隐 
私 ; 研究 人 员 越 是 面临 冲突 与 无 监管 状态 ， 对 强 有 力 的 知情 同意 的 需 
求 就 越 高 。 在 其 他 情况 下 ， 对 非常 有 力 的 知情 同意 的 需求 ， 对 所 有 事 
情 都 要 知情 同意 的 需求 ， 要 少 得 多 。 在 这 种 情况 下 ， 高 成 本 可 能 很 轻 
松 地 超过 了 其 本 身 的 需求 。 


这 次 争论 得 出 的 一 个 重要 见解 是 ， 知 情 同意 并 非 全 部 ， 也 不 是 一 
无 是 处 ， 有 更 强 形式 或 者 更 弱 形 式 的 同意 存在 。 在 一 些 场景 中 ， 强 有 
力 的 知情 同意 似乎 非常 必要 ， 但 在 为 一 些 情况 下 ， 弱 一 些 的 知情 同意 
的 形式 可 能 更 合适 。 接 下 来 ， 我 会 描述 三 种 研究 人 员 可 能 努力 去 获取 
知情 同意 的 理由 ， 并 且 给 这 些 事例 提供 一 些 选 项 。 


首先 ， 有 时 癌 参 与 者 提出 获取 知情 同意 可 能 增加 其 面 对 的 风险 。 
譬如， 在 “Encore” 项 目 中 ， 寻 求生 活 在 专制 政府 下 的 人 们 的 知情 同 
意 ， 用 他 们 的 计算 机 测量 互联 网 审查 制度 ， 可 能 会 让 他 们 号 处 风险 更 
高 的 境地 。 当 他 们 的 同意 导致 风险 增加 时 ， 研 究 人 员 可 以 确保 他 们 正 
在 做 的 事情 的 信息 是 公开 的 ， 参 与 者 可 以 选择 退出 。 同 样 ， 研 究 人 员 
也 可 以 寻求 代表 参与 者 的 组 织 机 构 〈 例 如 非 政 府 组 织 ) 。 


第 二 ， 有 时 在 研究 开始 之 前 获得 完全 知情 同意 可 能 会 损害 研究 的 
科学 价值 。 辟 如， 在 情绪 感染 项 目 中 ， 如 果 参 与 者 获知 研究 人 员 正 在 
做 一 个 关于 情绪 的 实验 ， 就 可 能 改变 他 们 的 行为 。 阻 碍 参与 者 获取 信 
恩 ， 甚 至 欺 驴 他 们 ， 在 社会 研究 中 并 不 少见 ， 特 别 是 在 心理 学 的 实验 
研究 中 。 如 果 在 研究 开始 之 前 无 法 获取 知情 同意 ， 那 么 研究 人 员 可 以 


(通常 也 这 样 ) 在 研究 结束 后 同 参与 者 进行 事后 说 明 。 这 样 的 事后 说 
明 通 常 包括 阐述 实验 的 过 程 、 对 任何 伤害 实施 补救 ， 以 及 事后 获取 同 
意 。 尽 管 如 此 ， 当 事后 说 明 本 身 可 能 对 参与 者 造成 伤害 时 ， 有 关 是 否 
在 实地 调查 中 对 参与 者 进行 说 明 ， 往 往 存 在 一 些 争 议 (Finn and 
Jakobsson 2007) 。 


第 三 ， 有 了 时间 受 影响 的 每 个 人 和 争取 知情 同意 在 逻辑 上 是 不 切实 际 
的 。 譬 如， 试想 一 下 ， 如 果 你 是 一 位 期 望 研究 比特 币 区 块 链 技术 《〈 比 
特 币 是 一 种 虚拟 货币 ， 区 块 链 是 比特 币 交 易 的 公开 记录 ) 的 研究 人 
员 。 不 阐 的 是 ， 获 取 每 一 个 使 用 比特 币 的 人 的 知情 同意 是 不 可 能 的 ， 
因为 大 多 数 人 都 是 匿名 的 。 在 这 样 的 情况 下 ， 研 究 人 员 可 以 尝试 联系 
一 个 比特 币 使 用 者 作为 样本 ， 癌 其 获取 知情 同意 。 


这 三 个 研究 人 员 可 能 无 法 取得 知情 同意 的 原因 ， 即 增加 风险 、 损 
害 研究 目标 以 及 逻辑 限制 ， 都 不 是 研究 人 员 努 力争 取 获 得 知情 同意 的 
全 部 原因 。 我 所 建议 的 解决 方案 一 一 癌 公 众 宣传 研究 成 果 、 人 允许 退出 
的 选择 、 寻 求 第 三 方 的 同意 、 事 后 说 明 ， 以 及 征求 参与 者 样本 的 同 
意 ， 在 所 有 情况 下 可 能 都 无 法 实现 。 此 外 ， 即 使 这 些 替 代 方 案 是 可 行 
的 ， 它 们 可 能 不 足以 用 于 既定 的 研究 。 尽 管 如 此 ， 这 些 例 子 所 展示 的 
知情 同意 既 不 是 全 部 ， 当 然 也 不 会 是 一 无 是 处 。 创 造 性 的 解决 方案 可 
以 在 无 法 获取 所 有 受 影 响 方 完全 知情 同意 的 情况 下 ， 改 善 其 道德 平 
衡 。 


总 而 言 之 ， 比 起 “所 有 事情 都 需要 知情 同意 ”， 研 究 人 员 应 该 、 
可 以 并 且 也 需要 遵循 一 个 更 复杂 的 准则 : 在 大 多 数 研 究 中 获得 某 种 形 
式 的 同意 。 束 原则 而 言 ， 出 于 对 人 的 尊重 原则 ， 知 情 同意 既 不 是 必要 
的 ， 也 不 是 充分 的 〈Humphreys 2015, p.102) 。 当 我 们 考虑 研究 伦理 
时 ， 对 人 的 尊重 原则 仅 是 需要 权衡 的 一 项 原则 ; 它 不 应 该 自动 凌 轨 于 
有 利 化 原则 、 公 正 原则 以 及 对 法 律 和 公共 利益 的 尊重 原则 之 上 ， 在 过 
去 的 40 年 中 ， 伦 理学 家 反复 指出 这 一 观点 (Gillon 2015, pp. 112- 
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务 论 的 角度 去 考虑 问题 ， 正 如 定时 炸弹 那个 例子 中 的 警察 一 样 (参见 
6.57) « 


最 终 ， 作 为 一 个 实际 问题 ， 如 果 你 正在 考虑 在 没有 任何 同意 的 情 
况 下 进行 研究 ， 那 么 你 应 该 知道 自己 正 处 于 灰色 地 带 。 请 注意 回顾 研 
完 人 员 为 了 在 未 经 同意 的 情况 下 进行 收视 实验 研究 而 提出 的 道德 论 
点 。 你 的 理由 足够 强 吗 ? 因为 知情 同意 是 许多 非 专业 道德 理论 的 核 
心 ， 你 应 该 知道 ， 你 很 可 能 会 被 要 求 为 你 的 决定 进行 辩护 。 


6.6.2 理解 与 管理 信息 化 风险 


言 息 化 风险 是 社会 研究 中 最 普遍 的 风险 ， 它 急剧 增加 ， 也 是 最 难 
理解 的 风险 。 


在 数字 时 代 的 社会 研究 中 ， 第 二 个 道德 挑战 就 是 信息 化 风险 ， 一 
种 因 汇 露 某 些 信息 而 带 来 的 潜在 伤害 (National Research Council 
2014) 。 来 自 个 人 信息 的 泄露 所 产生 的 信息 化 伤害 可 以 体现 在 经 济 方 
面 〈《 比 如 丢失 工作 ) 、 社 会 方面 (比如 喘 处 尴 罚 境地 )〉 、 心 理 方面 
《比如 抑郁 ) ， 甚 至 是 犯罪 方面 〈 比 如 因 非 法 行为 被 捕 ) © DEN 
是 ， 在 数字 时 代 ， 这 种 信息 化 伤害 急剧 增加 ， 因 为 我 们 的 行为 中 藏 有 
更 多 的 信息 。 相 较 于 模拟 时 代 下 社会 研究 所 关心 的 风险 ， 比 如 自然 风 
险 ， 信 息 化 风险 更 难 被 理解 与 管控 。 


研究 人 员 减 少 信息 化 风险 的 一 项 措施 是 数据 “匿名 化 ”。“ 匿 名 
化 ”是 从 数据 中 移 除 诸如 姓名 、 住 址 以 及 电话 号 码 等 显著 个 人 信息 的 
过 程 。 尽 管 如 此 ， 该 方法 远 不 如 许多 人 以 为 的 那样 有 效 ， 事 实 上 ， 这 
种 方法 的 深度 和 广度 均 受 到 限制 。 因 此 ， 无 论 何 时 ， 在 描述 “匿名 


化 ”时 ， 我 都 将 使 用 双 引 号 来 提醒 你 这 样 的 过 程 只 是 一 种 表面 的 匿 
名 ， 并 非 真正 的 匿名 。 


一 个 关于 “匿名 化 ”失败 的 生动 的 例子 来 自 20 世 纪 90 年 代 晚 期 的 
Ay wa SENN (Sweeney 2002) 。 团 体 保险 委员 会 (GIC〉 是 一 个 政府 机 
构 ， 对 缴纳 健康 保险 的 所 有 联邦 雇员 负责 。 通 过 这 样 的 工作 ， 团 体 保 
险 委 员 会 搜集 到 了 有 关联 邦 雇员 的 大 量 详尽 的 健康 记录 。 为 了 促进 研 
究 ， 团 体 保险 委员 会 决定 将 这 些 记录 发 布 给 研究 人 员 。 尽 管 如 此 ， 他 
们 并 不 会 公布 所 有 的 数据 ; 相反 ， 他 们 通过 删除 姓名 和 住址 等 信息 来 
“匿名 化 ”这 些 数据 。 但 是 ， 他 们 留 下 了 自己 认为 可 能 对 研究 人 员 有 
用 的 其 他 信息 ， 例 如 人 口 统计 信息 〈 邮 编 、 出 生日 期 、 族 裔 以 及 性 
别 ) ， 医 疗 信息 《医生 访问 时 间 、 诊 断 以 及 实施 步骤 ) (图 6. 4) 
(Ohm 2010) 。 不 驻 的 是 ， 这 种 “匿名 化 ”并 没有 充分 保护 这 些 数 
据 。 


姓名 


家 庭 住址 邮编 
邮编 出 生日 期 
出 生日 期 性 别 
性 别 MA 
族 裔 访问 时 间 
访问 时 间 诊断 
诊断 实施 步骤 
实施 步骤 服用 药物 


服用 药物 
“匿名 化 ” 


图 6.4 “匿名 化 ”是 移 除 显著 认证 信息 的 过 程 。 比 如 ， 当 公开 联邦 雇员 的 医疗 保险 
记录 时 ， 马 萨 诸 塞 州 团体 保险 委员 会 从 文件 中 移 除 姓名 以 及 家 庭 住址 等 信息 。 


为 了 说 明 团 体 保 险 委 员 会 “匿名 化 ”的 缺点 ， 拉 塔 尼 娅 。 斯 威 尼 
(Latanya Sweeney) ， 一 名 麻 省 理工 学 院 的 研究 生 ， 支 付 了 了 20 美元 购 


买 了 马萨诸塞 州 州长 威廉 ，。 韦 尔 德 (William Weld) 的 故乡 剑桥 市 的 
投票 记录 。 这 些 投票 记录 包括 了 诸如 姓名 、 住 址 、 邮 编 、 生 日 以 及 性 
别 等 信息 。 事 实 上 ， 医 疗 数据 文件 和 投票 记录 有 许多 共同 的 信息 ， 包 
括 邮 编 、 生 日 和 性 别 ， 这 意味 着 斯 威 尼 也 可 以 将 其 联系 起 来 。 斯 威 尼 
知道 韦 尔 德 的 生日 是 1945 年 ?月 31 日 ， 根 据 投 票 记录 ， 剑 桥 市 只 有 6 个 
人 有 同样 的 生日 。 再 进一步 ， 这 6 人 中 只 有 3 人 是 男性 。 接 下 来 ，3 位 男 
性 中 只 有 一 人 跟 韦 尔 德 的 邮编 一 至。 因此 ， 根 据 投 票数 据 显示 的 内 
容 ， 任 何人 都 能 够 将 韦 尔 德 的 生日 、 性 别 和 邮编 信息 与 医疗 记录 联系 
起 来 找 出 韦 尔 德 。 本 质 上 ， 这 三 条 信息 在 数据 中 像 是 他 的 一 个 独特 的 
指纹 信息 。 通 过 这 样 的 结果 ， 斯 威 尼 能 够 定位 出 韦 尔 德 的 医疗 记录 ， 
为 了 告知 韦 尔 德 她 的 成 就 ， 斯 威 尼 加 他 寄 送 了 一 份 数 据 找 见 (Ohm 
2010) 。 


斯 威 尼 的 工作 说 明了 “再 识别 攻击 ”的 基本 结构 ， 这 是 一 个 计算 
机 安全 领域 的 术语 。 在 这 些 攻击 中 ， 两 个 数据 库 本 身 都 没有 显示 敏感 
言 思 ， 但 两 个 数据 库 是 相互 关联 的 ， 通 过 这 种 联系 ， 攻 击 者 使 得 敏感 
信息 被 暴露 。 


We tet 姓名 


AA 邮编 

访问 时 间 住址 
诊断 de 党 派 
an 性 别 本 
实施 步骤 登记 日 期 


服用 药物 


“匿名 化 ”医疗 记录 投票 记录 


图 6.5 “匿名 化 ”数据 的 再 识别 。 拉 塔 尼 娅 。 斯 威 尼 通 过 结合 投票 记录 和 “匿名 
化 ”医疗 记录 ， 寻 找 威廉 。 韦 尔 德州 长 的 医疗 记录 。 来 源 于 Sweeney (2002) ， 图 


为 了 回应 斯 威 尼 的 工作 和 其 他 相关 工作 ， 研 究 人 员 现 在 通常 在 整 
个 “匿名 化 ”过 程 中 删除 更 多 的 信息 ， 即 所 谓 的 “个 人 识别 信息 ” 
(PII) (Narayanan and Shmatikov 2010) 。 上 此外， 许多 研究 人 员 现 
在 认识 到 ， 即 使 在 “匿名 化 ”之 后 ， 某 些 数据 《〈 如 医疗 记录 、 财 务 记 
录 、 有 关 非 法 行为 的 调查 问卷 回答 ) 也 可 能 过 于 敏感 。 我 要 讲 的 例子 
表明 社会 研究 人 员 需 要 改变 他 们 的 想法 。 作 为 第 一 步 ， 假 设 所 有 数据 
都 有 可 能 被 识别 ， 并 且 所 有 数据 都 可 能 是 敏感 的 ， 这 是 明智 的 。 换 句 
话说 ， 与 其 认为 信息 化 风险 适用 于 一 小 部 分 项 目 ， 我 们 还 不 如 假设 它 
在 某 种 程度 上 适用 于 所 有 项 目 。 


网 飞 奖 表明 了 这 种 重新 定位 的 两 个 方面 。 正 如 第 5 章 所 描述 的 ， 网 
飞 公司 公布 了 由 近 50 万 名 会 员 提 供 的 1 亿 条 电影 评级 信息 ， 并 且 公 开征 
集 来 目 世 界 各 地 的 人 提交 的 算法 ， 以 提高 其 推荐 电影 的 能 力 。 在 公布 
这 些 数据 之 前 ， 网 飞 公 司 移 除 了 所 有 显著 的 个 人 认证 信息 ， 比 如 姓名 
等 。 他 们 还 增加 了 一 项 特别 措施 ， 在 一 些 记录 中 引入 了 轻微 的 干扰 项 
《比如 将 某 些 评级 由 4 星 改 为 3 星 ) 。 尽 管 如 此 ， 网 飞 很 快 发 现 ， 虽 然 
他 们 付出 了 相应 的 努力 ， 但 数据 仍然 不 是 匿名 的 。 


仅 在 他 们 公开 这 些 数 据 的 两 周 后 ， 阿 尔 温 德 。 纳 拉 亚 南 与 维 塔 利 
“ 施 马 季 科 夫 束 表明 ， 了 解 特 定 人 群 的 电影 喜好 是 可 能 的 。 其 守门 在 
于 采用 与 斯 威 尼 手 法 相似 的 再 识别 攻击 : 把 两 个 信息 源 合 为 一 体 ， 一 
个 信息 源 具 有 潜在 的 敏感 信息 ， 但 没有 明显 的 识别 信息 ， 男 一 个 包含 
人 的 身份 信息 。 虽 然 各 目的 信息 源 可 能 都 是 相对 安全 的 ， 但 是 它们 被 
合并 后 ， 束 增加 了 信息 化 风险 。 在 网 飞 数据 的 例子 中 ， 就 发 生 了 这 样 
的 事 。 试 想 一 下 ， 当 我 选择 与 同事 分 享 我 天 于 动作 电影 与 喜剧 电影 的 
想法 时 ， 我 并 不 会 愿意 分 诗 我 对 宗教 和 政治 类 电影 的 看 法 。 我 的 同事 
可 能 利用 我 所 分 至 的 看 法 去 网 飞 数据 库 中 找到 相关 信息 。 我 所 分 享 的 
信息 可 能 像 威廉 。 韦 尔 德 的 生日 、 邮 编 、 性 别 信息 那样 ， 成 为 一 个 独 
特 的 指纹 。 他 们 可 以 了 解 到 我 对 所 有 电影 的 评价 ， 包 括 我 选择 不 分 享 


的 电影 。 除 了 这 种 针对 单 人 的 目标 攻击 之 外 ， 纳 拉 亚 南 与 施 马 季 科 夫 
还 表明 ， 通 过 将 网 飞 数据 与 条 些 人 选择 在 互联 网 电影 数据 库 (IMDb) 
上 发 布 的 电影 评级 数据 合并 ， 可 以 进行 广泛 攻击 ， 即 涉及 多 人 的 攻 
击 。 很 简单 ， 任 何 特定 人 员 的 独特 指纹 信息 ， 即 使 是 他 们 的 电影 评级 
言 轧 ， 都 可 以 用 于 识别 他 们 。 


尽管 网 飞 数据 可 以 被 用 于 再 识别 攻击 或 广泛 攻击 ， 但 是 它 仅 可 能 
是 低 风 险 的 。 毕 竟 ， 电 影评 级 信息 看 起 来 并 不 那么 敏感 。 虽 然 这 在 通 
常情 况 下 是 正确 的 ， 但 对 集中 了 50 万 人 的 数据 库 来 说 ， 电 影评 级 信息 
可 能 就 相当 敏感 。 事 实 上 ， 作 为 对 再 识别 的 回应 ， 一 名 未 公开 冉 份 的 
女 同 性 恋 者 加 入 了 对 网 飞 公 司 的 集体 诉讼 中 。 


网 飞 奖 数据 的 再 识别 说 明 ， 所 有 数据 都 有 可 能 被 识别 ， 并 且 所 有 
数据 都 可 能 是 敏感 的 。 此 时 ， 你 可 能 会 认为 这 只 适用 于 那些 与 人 有 关 
的 数据 。 令 人 惊讶 的 是 ， 其 实 不 是 这 样 的 。 为 了 回应 《信息 自由 法 》 
的 请 求 ， 纽 约 市 政府 公开 了 2013 年 纽约 市 所 有 的 出 租车 行驶 记录 ， 包 
括 其 接客 与 沙 客 的 时 间 、 位 置 以 及 付款 金额 等 信息 (回顾 第 2 章 ， 法 伯 
使 用 了 类 似 的 数据 来 检验 劳动 经 济 学 中 的 重要 理论 ) 。 这 些 有 关 出 租 
车 行程 的 数据 可 能 看 起 来 没什么 问题 ， 因 为 它们 并 不 涉及 人 的 信息 ， 
但 安东尼 。 托 卡 (Anthony Tockar) 意识 到 这 些 出 租车 数据 库 实 际 上 
包含 了 许多 有 关 人 的 潜在 敏感 信息 。 为 了 确认 这 一 点 ， 他 浏览 了 午夜 
到 早上 6 点 从 纽约 一 家 大 型 脱衣 舞 酒吧 出 发 的 行程 记录 ， 并 找到 其 落 客 
位 置 。 这 项 搜索 实质 上 找 出 了 一 些 经 常 光 顾 这 个 酒吧 的 人 的 住址 
(Tockar 2014) 。 很 难 想象 市 政府 在 公布 数据 时 是 否 考虑 到 了 这 一 
点 。 事 实 上 ， 用 同样 的 办 法 可 以 找到 去 这 座 城 市 任何 地 方 ， 包 括 去 诊 
所 、 政 府 大 楼 或 者 是 宗教 场所 的 人 的 家 性 住址 。 


网 飞 奖 和 纽约 市 出 租车 数据 的 这 两 种 情况 表明 ， 相 对 有 经 验 的 人 
也 可 能 无 法 正确 地 估计 他 们 发 布 的 数据 中 存在 的 信息 化 风险 ， 而 这 些 
案例 并 非 个 例 C Barbaro and Zeller 2006; Zimmer 2010; 


Narayanan, Huey, and Felten 2016) 。 而 且 ， 在 许多 这 样 的 情况 
下 ， 有 问题 的 数据 仍然 可 以 被 在 线 免 费 获 取 ， 这 表明 撤销 已 发 布 的 数 
据 是 非常 困难 的 。 总 的 来 说 ， 这 些 例 子 以 及 计算 机 科学 关于 隐私 的 研 
究 引 出 了 一 个 重要 的 结论 。 研 究 人 员 应 该 假定 所 有 数据 都 有 可 能 被 识 
别 ， 并 且 所 有 数据 都 可 能 是 敏感 的 。 


不 过 的 是 ， 并 不 存在 简单 的 解决 方案 ， 也 束 是 说 所 有 的 数据 都 可 
能 被 识别 ， 并 且 所 有 数据 都 可 能 是 敏感 的 。 尽 管 如 此 ， 在 你 的 数据 工 
作 中 ， 其 中 一 项 能 够 降低 信息 化 风险 的 措施 是 创建 并 遵循 一 个 数据 保 
护 计 划 。 访 项 计划 能 够 降低 你 泄露 数据 的 概率 ， 并 且 在 数据 泄露 发 生 
后 能 够 降低 伤害 。 随 着 时 间 的 推移 ， 数 据 保护 计划 的 具体 项 目 ， 包 括 
He EA ee sh, BENE. HR SHEARS FD (UK Data 
Services) 有 效 地 归纳 了 数据 保护 计划 所 必 备 的 5 项 要 素 ， 他 们 称 之 为 
“5 个 安全 ”: 项 目 安全 、 对 象 安全 、 数 据 安 全 、 设 置 安全 、 成 果 安 全 
( 表 6.2) (Desai, Ritchie, and Welpton 2016) 。 这 5 项 安全 措施 
中 的 任何 单独 一 项 都 不 能 提供 完美 的 保护 措施 。 但 是 将 它们 组 合 在 一 
起 ， 则 可 以 有 力 降低 信息 化 风险 。 

表 6. 2 “5 个 安全 ”是 设计 和 执行 数据 保护 计划 的 原则 


项 目 安 全 对 涉及 道德 伦理 的 项 目 数据 采取 限制 措施 


对 象 安全 访问 仅 限于 可 信任 的 数据 人 员 ( 例如 ， 经 过 道德 培训 的 人 ) 


数据 安全 尽 可 能 将 数据 去 标识 并 汇总 


对 储存 于 计算 机 中 的 数据 采取 适当 的 物理 (例如 ， 锁 闭 的 房间 ) 


设置 安全 dd o , 
和 软件 ( 例如， 密码 保护 、 加 密 ) 保护 


成 果 安 全 审查 研究 成 果 以 防止 意外 隐私 泄露 


除了 在 使 用 数据 时 保护 数据 以 外 ， 研 究 过 程 中 信息 化 风险 特别 突 
出 的 一 个 步骤 是 与 其 他 研究 人 员 共 至 数据 。 科 学 家 之 间 的 数据 共有 至 古 


科学 探索 的 核心 价值 ， 并 且 它 能 够 在 很 大 程度 上 促进 知识 的 进步 。 以 
下 是 英国 下 议院 对 数据 共享 重要 性 的 看 法 (Molloy 2011) : 


如 果 研 究 人 员 要 重 现 、 验 证 文献 中 发 表 的 结果 并 在 其 基础 上 建立 
其 他 研究 ， 获 取 数 据 是 至 关 重 要 的 。 因 此 我 们 必须 假定 ， 除 非 拥 有 很 
强 的 其 他 理由 ， 和 否则 数据 应 该 被 充分 披露 并 公开 。 


至 此 ， 当 与 其 他 研究 人 员 共 享 数 据 时 ， 你 可 能 增加 了 你 的 信息 化 
风险 。 因 此 ， 似 乎 在 与 其 他 科学 家 分 享 数据 的 义务 和 为 参与 者 减少 信 
恩 化 风险 的 义务 之 间 ， 共 享 数 据 这 一 行为 带 来 了 基础 性 的 紧张 关系 。 
幸运 的 是 ， 这 种 矛盾 并 不 像 看 起 来 那么 严重 。 相 反 ， 最 好 将 数据 共享 
视 为 一 个 连续 统一 体 ， 这 个 连续 统一 体 的 每 一 点 提供 了 不 同 的 社会 收 
益 与 参与 者 风险 的 组 合 ( 图 6. 6) 。 
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图 6.6、 数据 共享 的 策略 位 于 一 个 连续 统一 体 之 中 。 你 应 该 在 这 个 连续 统一 体 中 的 哪 
个 部 分 ， 取 决 于 你 的 数据 具体 细节 ， 第 三 方 监管 可 能 会 帮助 你 决定 案例 中 风险 收益 


a an 
015) © 

在 一 种 极端 情况 下 ， 你 可 以 不 对 任何 人 共享 你 的 数据 ， 这 样 的 话 
参与 者 风险 也 就 最 小 化 了 ， 相 应 社会 收益 也 最 小 。 在 另 一 种 极端 情况 
下 ， 你 可 以 无 特定 对 象 公 开 ， 数 据 被 “匿名 化 ”并 被 所 有 人 使 用 。 相 
较 于 不 公开 数据 ， 这 种 无 特定 对 象 公开 能 够 提供 更 高 的 社会 收益 ， 但 
也 随 之 给 参与 者 市 来 了 更 高 的 风险 。 在 这 两 种 极端 情况 之 间 的 混合 范 
围 里 ， 存 在 一 种 我 称 之 为 保护 性 公开 的 方法 。 在 这 样 的 方法 下 ， 你 可 
以 将 数据 与 符合 特定 标准 并 同意 受 某 些 规 则 约束 的 人 共享 〈 比 如 在 机 
构 审查 委员 会 和 数据 保护 计划 的 监管 下 ) 。 这 种 保护 性 公开 的 方法 提 
供 了 许多 公开 的 好 处 ， 并 减少 了 无 特定 对 象 公开 的 风险 。 当 然 ， 这 样 
的 方法 也 会 产生 很 多 问题 ， 比 如 ， 谁 能 获得 这 样 的 权限 ， 在 什么 样 的 
条 件 下 ， 能 使 用 多 和 久 ， 谁 又 为 这 样 的 保护 性 公开 所 带 来 的 监管 成 本 埋 
单 等 ， 但 这 些 都 是 可 以 被 解决 的 。 事 实 上 ， 在 有 些 地 方 ， 现 在 已 经 有 
相应 的 保护 性 公开 方法 被 研究 人 员 采 用 了 ， 比 如 密 歇 根 大 学 的 校 际 政 
治 及 社会 研究 联盟 CICPSR) 的 数据 档案 。 


那么 ， 你 在 研究 中 将 采取 何 种 数据 处 理 措 施 ? 非 公开 ,保护 性 公 
开 ， 还 是 无 特定 对 象 公 开 ? 这 个 取决 于 你 的 数据 的 具体 情况 ， 研 究 人 
员 必 须 权 衡 四 项 原则 。 从 这 个 角度 看 ， 数 据 共 至 并 不 是 一 个 独特 的 道 
德 难 题 ， 它 只 是 研究 人 员 必 须 找到 合适 的 道德 平衡 的 许多 方面 之 一 。 


一 些 批 评 家 普遍 反对 数据 共 译 ， 在 我 看 来 ， 他 们 专注 于 风险 ， 这 
无 疑 是 对 的 ， 但 他 们 忽略 了 它 的 好 处 。 因 此 ， 为 了 或 励 关注 风险 与 收 
蔓 ， 我 想 提 供 一 个 类 比 。 每 年 ， 因 为 汽车 所 产生 的 事故 都 会 造成 数 以 
干 计 的 人 人 死亡， 但 是 我 们 不 会 试图 茶 止 驾车 。 事 实 上 ， 禁 止 驾 车 的 呼 
吁 是 隐 座 的 ， 因 为 驾车 也 能 为 我 们 带 来 许多 美好 的 事情 (不 能 因 喧 废 
食 ) 。 相 反 ， 社 会 可 以 限制 谁 能 驾车 (例如 ， 震 要 达到 茶 个 年 龄 并 通 
过 茶 些 测试 ) ， 以 及 他 们 如 何 驾 车 例如 在 限 速 的 情况 下 〉， 社 会 也 
有 负责 执行 这 些 规 定 的 人 员 《 例 如 和 警察) ， 我 们 会 惩 避 那些 违反 规则 


的 人 。 同 样 ， 社 会 管理 驾车 问题 的 平衡 思想 也 可 以 用 于 数据 共 孚 的 过 
程 。 也 就 是 说 ， 我 认为 我 们 可 以 通过 降低 风险 和 提高 数据 共 孕 收益， 
获取 最 大 的 进展 ， 而 不 是 为 数据 共 至 提供 绝对 的 支持 或 反对 论据 。 


总 而 言 之 ， 信 息 化 风险 增长 迅速 ， 并 且 很 难 预测 和 衡量 。 因 此 ， 
最 好 假设 所 有 的 数据 都 有 可 能 和 被 识别 ， 并 且 所 有 的 数据 都 可 能 是 敏感 
的 。 为 了 在 研究 过 程 中 减少 信息 化 风险 ， 研 究 人 员 可 以 创建 并 遵循 一 
些 数 据 保 护 措施 。 另 外 ， 信 息 化 风险 不 会 阻止 研究 人 员 从 其 他 科学 家 
处 获得 共 至 数据 。 


6. 6.3 隐私 权 


隐私 权 是 让 信息 适当 流通 的 权利 。 


第 三 个 研究 人 员 应 该 努力 完善 的 方 回 是 隐私 权 。 劳 伦 斯 非常 简明 
地 指出 : “隐私 权 也 应 该 像 人 一 样 受到 尊重 。” (Lowrance 2012) I 
管 如 此 ， 隐 私 权 是 一 个 众所周知 的 混乱 的 概念 (Nissenbaum 2010) 。 
因此 ， 在 答 试 做 出 有 关 研 究 的 特定 决策 时 ， 使 用 它 很 困难 。 


考虑 隐私 权 的 和 常见 方式 是 公 / 私 二 分 法 。 通 过 这 样 的 思考 方法 ， 如 
果 信 息 可 以 公开 获取 ， 那 么 研究 人 员 使 用 它 就 不 用 在 意 侵犯 了 公民 的 
隐私 权 。 然 而 使 用 这 样 的 方法 会 产生 问题 。 例 如 ， 在 2007 年 11 月 ， 科 
斯 塔 斯 。 帕 纳 戈 普 洛 斯 (Costas Panagopoulos) 向 三 个 城镇 的 每 个 人 
发 出 了 关于 即将 举行 选举 的 信件 。 在 艾 奥 瓦 州 的 蒙 带 赛 洛 和 密歇根 州 
的 霍 兰 这 两 个 小 镇 ， 由 纳 戈 普 洛 斯 在 报纸 上 保证 /威胁 将 要 公布 一 份 参 
与 投票 的 人 的 名 单 。 在 男 一 个 小 镇 ， 艾 奥 瓦 州 的 伊利 ， 帕 纳 戈 普 洛斯 
保证 /威胁 公布 一 份 没 有 投票 的 人 的 名 单 。 这 些 措 施 则 在 引发 自 聚 感 与 
着 耻 感 (Panagopoulos 2010) ， 因 为 这 些 情绪 在 早期 研究 中 被 发 现 会 
影响 投票 率 (Gerber, Green, and Larimer 2008) 。 在 美国 有 关 谁 参 


与 投票 、 谁 未 参与 投票 的 信息 是 公开 的 ， 并 且 任 何人 都 可 以 获取 。 因 
此 ， 有 人 可 能 会 争辩 将， 因为 这 个 投票 信息 已 经 公开 了 ， 上 所 以 研究 人 
员 在 报纸 上 公布 它 没 有 问题 。 但 这 个 论点 对 某 些 人 来 说 则 会 引起 不 
JE, 


TEMA AE ATA, A/a ANNEAL HO (Boyd and 
Crawford 2012; Markham and Buchanan 2012) 。 思 考 隐 私 权 的 一 种 
更 好 的 方式 是 情境 完整 性 ， 这 是 一 种 专门 用 于 处 理 数字 时 代 问 题 的 方 
法 (Nissenbaum 2010) 。 情 境 完 整 性 关注 的 是 信息 流通 ， 而 不 是 将 信 
县 视 为 公共 或 私人 信息 。 引 述 尼 森 鲍 姆 (Nissenbaum) Mit: “隐私 
权 既 不 是 保密 权 ， 也 不 是 控制 权 ， 而 是 适当 流通 个 人 信息 的 权利 。” 


情境 完整 性 的 基本 概念 是 与 情境 相关 的 信息 化 规范 (Nissenbaum 
2010) 。 这 就 是 管理 特定 情境 中 信息 流通 的 规范 ， 它 们 由 三 个 要 素 决 


J 


JE: 


。 角 色 (主体 、 发 送 者 、 接 收 者 ) ; 
。 属 性 (信息 类 型 ) ; 


。 传输 原则 〈 信 息 流通 的 限制 ) 。 


因此 ， 作 为 一 名 研究 人 员 ， 当 你 正在 决定 是 否 未 经 允许 使 用 数据 
时 ， 它 能 够 帮助 你 询问 自己 ， 这 样 做 是 否 侵 犯 了 与 情境 相关 的 信息 化 
规范 。 回 到 帕 纳 戈 普 洛 斯 的 例子 来 ， 在 这 个 例子 中 ， 外 部 研究 人 员 在 
报纸 上 公开 选民 或 非 选 民 名 单 ， 这 似乎 可 能 会 违背 信息 化 规范 。 这 可 
能 不 是 人 们 期 望 的 信息 流通 方式 。 事 实 上 ， 帕 纳 戈 普 洛 斯 没有 执行 他 
的 保证 /威胁 ， 因 为 当地 选举 官员 从 这 些 信件 中 奶 查 到 他 ， 并 劝 他 说 这 
并 不 是 一 个 好 的 想法 (Issenberg 2012, p. 307) 。 


与 情境 相关 的 信息 化 规范 ， 也 可 以 帮助 评估 我 在 本 章 开 始 时 讨论 
的 情况 ， 即 2014 年 在 西非 埃 博 拉 疫情 骏 发 期 间 使 用 手机 通话 记录 追踪 
人 口 流动 性 的 例子 (Wesolowski et al. 2014) 。 在 这 样 的 环境 设 定 
中 ， 我 可 以 想到 两 种 不 同 的 情境 : 


“ 情境 1: 发 送 完整 的 通话 记录 数据 【属性 ) ; 给 不 完全 合法 的 
BUY (E); 用 以 应 对 未 来 任何 可 能 的 使 用 《传输 原则 ) 。 


. 情境 2: 发 送 部 分 匿名 记录 (属性 ) ; 给 受 尊敬 的 大 学 研究 人 
员 (角色 ) ; 用 以 应 对 埃 博 拉 疫 情 ， 并 接受 大 学 机 构 委员 会 的 监督 
(传输 原则 ) 。 


尽管 在 这 两 种 情境 下 ， 通 话 数 据 都 从 移动 通信 公司 流出 ， 但 鉴于 
角色 、 属 性 和 传输 原则 之 间 的 差异 ， 这 两 种 情况 的 信息 化 规范 并 不 相 
同 。 只 关注 其 中 一 个 参数 可 能 导致 过 于 简单 的 决策 。 事 实 上 ， 尼 和 森 鲍 
姆 强调 ， 这 三 个 参数 不 能 缩减 为 其 他 两 个 参数 ， 任 何 单一 参数 也 不 能 
单独 定义 信息 化 规范 。 信 息 化 规范 的 三 维 性 质 解 释 了 为 什么 过 去 的 努 
力 ， 即 侧重 于 属性 或 传输 原则 的 努力 ， 在 保护 隐私 方面 效果 不 佳 。 


用 与 情境 相关 的 信息 化 规范 来 指导 决策 的 一 个 挑战 是 ， 研 究 人 员 
可 能 不 会 提前 知道 它们 ， 并 且 它 们 很 难 衡 量 CAcquisti, 
Brandimarte, and Loewenstein 2015) 。 进 一 步 来 说 ， 即 使 一 些 研究 
人 员 会 违反 与 情境 相关 的 信息 化 规范 ， 也 并 不 自动 意味 着 其 研究 不 应 
该 进行 。 事 实 上 ， 尼 森 鲍 姆 著作 的 第 8 章 完 全 阐明 了 “为 了 好 事 而 破坏 
规则 ”。 尽 管 存在 这 些 复杂 性 ， 但 是 与 情境 相关 的 信息 化 规范 仍然 是 
推断 隐私 权 相 关 问题 的 有 用 方式 。 


最 后 ， 隐 私 权 的 问题 是 我 所 见 过 的 优先 考虑 对 人 的 世 重 原则 与 优 
先 考 虑 有 利 化 原则 的 研究 人 员 之 间 普 过 存在 误解 的 地 方 。 试 想 一 下 ， 
公共 卫生 研究 人 员 为 了 防止 新 型 传染 病 的 传播 ， 秘 密 观 察 了 正在 洗 识 
的 人 们 。 关 注 有 利 化 原则 的 研究 人 员 在 乎 这 项 研究 对 社会 带 来 的 好 


处 ， 并 且 可 能 会 争辩 资 ， 如 果 研 究 人 员 在 没有 航 发 现 的 情况 下 进行 了 
偷 看 行为 ， 那 么 参与 者 就 没有 受到 伤害 。 忆 一 方面 ， 优 先 考 碟 对 人 的 
尊重 原则 的 研究 人 员 关 注 的 是 研究 人 员 没 有 对 人 的 起 码 尊重 ， 并 可 能 
认为 这 侵犯 了 参与 者 的 隐私 权 ， 造 成 了 伤害 ， 即 使 在 参与 者 没有 意识 
到 他 们 被 偷 看 的 情况 下 。 换 句 话 说 ， 对 这 些 研究 人 员 来 说 ， 侵 犯人 们 
的 隐私 权 本 里 就 是 一 种 伤害 。 


总 而 言 之 ， 在 考虑 隐私 权 问 题 时 ， 这 有 助 于 我 们 超越 过 于 简单 化 
的 公 / 私 二 分 法 ， 而 采用 与 情境 相关 的 信息 化 规范 ， 其 由 三 个 要 素 组 
成 : FA (EM, RIES. Bae) ， 属 性 (信息 类 型 )， 以 及 传输 
原则 (信息 流通 的 限制 ) (Nissenbaum 2010) 。 一 些 研 究 人 员 根 据 隐 
私 侵 害 可 能 导致 的 伤害 来 评估 隐私 权 ， 而 其 他 研究 人 员 则 认为 侵犯 隐 
私 权 本 里 就 是 一 种 伤害 。 许 多 数字 系统 的 隐私 概念 随时 间 而 变化 ， 因 
Atti ®, FH 情况 而 异 (© Acquisti, Brandimarte, and 
Loewenstein 2015) ， 因 此 隐私 权 很 可 能 在 未 来 某 些 时 候 成 为 研究 人 
员 在 伦理 决策 中 遭遇 困难 的 根源 。 


6.6.4 面 对 不 确定 性 做 出 决策 


不 确定 性 不 一 定 姓 致 无 所 作为 。 


我 期 望 研究 人 员 努 力 的 第 四 个 也 是 最 后 一 个 领域 是 面 对 不 确定 性 
做 出 决策 ， 也 就 是 说 ， 在 哲学 化 和 权衡 利 观 、 研 究 伦 理 问 题 后， 决定 
做 什么 和 不 做 什么 。 不 笠 的 是 ， 这 些 决策 往往 基于 不 完整 的 信息 。 璧 
a1, Swit “Encore” SHAW, HRARHERENETESFTERN 
被 警方 找 上 门 的 可 能 性 。 或 者 在 设计 情绪 传染 项 目 时 ， 研 究 人 员 可 能 
希望 知道 它 引 发 茶 些 参与 者 抑郁 的 可 能 性 。 这 些 概率 可 能 非常 低 ， 但 
在 研究 发 生 之 前 它们 是 未 知 的 。 而 且 ， 因 为 这 两 个 项 目 都 没有 公开 扎 
踪 有 关 不 民事 件 的 信息 ， 所 以 其 概率 仍然 不 为 众人 所 知 。 


在 数字 时 代 ， 不 确定 性 并 不 是 社会 研究 所 特有 的 。 当 《贝尔 蒙 报 
告 》 摘 述 了 风险 与 收益 的 系统 评估 时 ， 它 明确 承认 这 些 很 难 精确 量 
化 。 尽 管 如 此 ， 这 些 不 确定 性 在 数字 时 代 更 为 严重 ， 部 分 原因 是 我 们 
对 这 类 研究 的 经 验 较 少 ， 男 外 一 部 分 原因 在 于 其 研究 本 里 的 特点 。 


鉴于 这 些 不 确定 因素 ， 有 些 人 似乎 主张 “安全 性 高 于 遗憾 的 产 
生 ”， 这 和 是 预防 原则 的 口语 化 解释 。 虽 然 这 种 方法 看 似 是 合 理 的 ， 甚 
至 可 能 是 明智 的 ， 但 它 实际 上 可 能 会 造成 伤害 。 它 让 研究 环境 变 得 冷 
淡 ， 并 且 导 致 人 们 对 局 势 的 看 法 过 于 狭隘 〈Sunstein 2005) 。 为 了 更 
好 地 理解 预防 原则 的 问题 ， 让 我 们 回 到 情绪 感染 的 例子 中 。 实 验 计划 
涉及 大 约 70 万 人 ， 实 验 中 肯定 有 人 会 受到 伤害 。 但 是 ， 这 个 实验 也 有 
可 能 产生 对 脸谱 网 用 户 和 社会 有 益 的 知识 。 因 此 ， 虽 然 允 许 实验 有 风 
险 《 正 如 已 经 充分 讨论 过 的 那样 ) ， 但 阻碍 实验 也 有 风险 ， 因 为 实验 
可 能 会 产生 宝 贯 的 知识 。 当 然 ， 选 择 做 还 是 不 做 实验 并 不 是 在 实验 发 
生 时 进行 的 。 对 实验 设计 有 很 多 修改 方式 ， 它 们 可 能 将 其 融入 不 同 的 
道德 平衡 。 然 而 ， 在 茶 些 时 候 ， 研 究 人 员 可 以 在 做 研究 和 不 做 研究 之 
间 做 出 选择 。 行 动 和 不 行动 都 有 风险 ， 仅 仅 关 注 行动 的 风险 是 不 恰当 
的 。 原 因 很 简单 ， 并 不 存在 完全 无 风险 的 方法 。 


跳出 预防 原则 的 限制 ， 在 面 对 不 确定 性 时 做 出 决定 的 一 个 重要 方 
法 是 最 小 化 风险 标准 。 该 标准 试图 将 特定 研究 的 风险 和 参与 者 在 日 党 
生活 中 承担 的 风险 (例如 运动 或 驾车 ) 进行 比较 (Wendler et al. 
2005) 。 这 种 方法 是 有 价值 的 ， 因 为 评估 是 否 符合 最 低 风 险 标准 比 评 
估 实 际 风 险 水 平 更 容易 。 辟 如， 在 情绪 感染 项 目 中 ， 在 研究 开始 之 
前 ， 研 究 人 员 可 以 将 实验 中 新 消息 反馈 的 情绪 内 容 与 脸谱 网 上 的 其 他 
新 消息 反馈 的 情绪 内 容 进行 比较 。 如 果 它 们 是 相似 的 ， 那 么 研究 人 员 
就 可 以 在 符合 最 小 风险 标准 的 情况 下 进行 实验 (Meyer 2015) 。 即 使 
不 知道 风险 的 绝对 程度 ， 他 们 也 可 以 做 出 这 个 决定 。 该 方法 同样 可 以 
应 用 于 “Encore” 项 目 中 。 最 初 ，“Encore” 项 目 触 发 了 对 已 知 敏感 
网 站 的 请 求 ， 例 如 那些 专制 政府 所 禁止 的 政治 浣 派 网 站 。 因 此 ， 这 对 


某 些 国家 的 参与 者 来 说 风险 不 小 。 正 因 如 此 ，“Encore” 的 修订 版 本 
仅 同 推 符 、 脸 谱 网 和 优 免 发 出 请 求 ， 这 样 的 话 它 束 符合 最 小 化 风险 的 
标准 ， 因 为 其 请 求 是 在 人 们 正常 浏览 网 页 期 间 触 发 的 (Narayanan and 
Zevenbergen 2015) 。 


当 他 们 决定 进行 具有 未 知 风险 的 研究 时 ， 第 二 个 重要 思想 是 效果 
分 析 ， 它 允许 研究 人 员 计 算 他 们 所 需要 的 样本 大 小 ， 从 而 可 靠 地 检测 
对 给 定 大 小 的 样本 的 影响 (Cohen 1988) 。 如 果 你 的 研究 可 能 使 参与 
者 面临 风险 ， 即 使 是 最 小 的 风险 ， 那 么 根据 有 利 化 原则 ， 你 也 应 该 为 
实现 研究 目标 而 设置 最 小 的 风险 《〈 回 到 第 4 章 中 的 减少 参与 者 原则 ) 。 
尽管 一 些 研究 人 员 倾 向 于 让 他 们 的 研究 规模 尽 可 能 大 ， 但 研究 伦理 建 
议 研 究 规模 应 该 尽 可 能 小 。 效 果 分 析 当 然 不 是 新 功能 ， 但 它 在 模拟 时 
代 的 使 用 方式 与 今天 有 着 重要 的 区 别 。 在 模拟 时 代 ， 研 究 人 员 通 过 进 
行 效 果 分 析 ， 确 保 他 们 的 研究 规模 不 是 太 小 〈 即 效能 不 足 ) 。 然 而 ， 
现在 的 研究 人 员 应 该 利用 效果 分 析 确 保 他 们 的 实验 规模 不 会 过 大 〔 即 
效能 过 剩 ) 。 


最 低 风 险 标 准 和 效果 分 析 可 以 帮助 你 衡量 和 设计 研究 ， 但 是 它们 
无 法 提供 任何 有 关 参 与 者 如 何 看 符 你 的 研究 以 及 他 们 参与 研究 会 遇 到 
什么 风险 之 类 的 新 信息 。 处 理 不 确定 性 的 另 一 种 方法 就 是 搜集 更 多 的 
信息 ， 即 进行 道德 反应 调查 与 阶段 性 测试 。 


在 道德 反应 调查 中 ， 研 究 人 员 会 对 提议 的 研究 项 目 进行 简要 描 
述 ， 然 后 提出 两 个 问题 : 


。 问题 1: “如 果 你 关心 的 人 是 这 个 实验 的 候选 参与 者 ， 你 是 否 
希望 他 成 为 参与 者 ? ”回答 是 、 无 所 谓 、 否 : 


. 问题 2: “你 认为 应 该 允许 研究 人 员 继 续 这 个 实验 吗 ? ”回答 
是 、 是 (但 是 要 注意 ) 、 不 确定 、 否 。 


EF RIA Za, ER AR RIS Se. Bas 
可 能 成 为 参与 者 的 人 或 可 能 从 微 任务 劳动 力 市 场 ( 如 机 器 人 MTurk) 被 
招 勇 的 受 访 者 也 会 回答 一 些 基 本 的 人 口 统计 学 问题 。 


道德 反应 调查 有 三 个 特点 ， 我 认为 特别 具有 吸引 力 。 首 先 ， 它 们 
在 研究 之 前 就 已 经 发 生 ， 因 此 可 以 在 研究 开始 之 前 预防 问题 的 产生 
(这 与 监测 不 恨 反应 的 方法 相反 ) 。 其 次 ， 道 德 反 应 调查 的 受 访 者 通 
常 不 是 研究 人 员 ， 因 此 这 有 助 于 研究 人 员 从 公众 的 角度 看 符 他 们 的 研 
究 。 最 后 ， 道 德 反 应 调查 使 研究 人 员 能 够 提出 多 个 版 本 的 研究 项 目 ， 
以 评价 不 同 版 本 对 同一 项 目的 伦理 平衡 。 尽 管 如 此 ， 道 德 反 应 调查 的 
-个 局 限 性 是 ， 在 调查 结果 给 出 的 不 同 研 究 设 计 之 间 ， 如 何 做 出 决 
定 ， 它 并 不 明确 。 但 是 ， 忽 略 这 种 局 限 性 ， 道 德 反 应 调查 不 失 为 是 有 
帮助 的 ， 事 实 上 ， 侈 希 特 尔 (Schechter) AA HIK © AY (Bravo- 
Lillo) 束 放弃 了 一 项 计划 中 的 研究 ， 以 回应 参与 者 在 道德 反应 调查 中 
提出 的 问题 。 


虽然 道德 反应 调查 有 助 于 评估 对 计划 研究 的 反应 ， 但 它们 无 法 衡 
量 不 良 事件 的 可 能 性 或 严重 程度 。 医 学 研究 人 员 人 处理 高 风险 环境 下 不 
确定 性 的 一 种 方法 是 进行 阶段 性 实验 ， 这 种 方法 可 能 对 某 些 社会 研究 
有 帮助 。 当 测试 新 药 的 有 效 性 时 ， 研 究 人 员 不 会 立即 跳 至 大 规模 的 随 
机 对 照 实验 的 阶段 。 相 反 ， 他 们 首先 进行 两 种 类 型 的 研究 。 最 初 ， 在 I 
期 试验 中 ， 研 究 人 员 特 别 关 注 寻 找 安 全 剂量 ， 这 阶段 研究 仅 涉 及 少数 
人 人。 一旦 确定 了 安全 剂量 ，II 期 试验 惑 会 评估 该 药物 的 疗效 ， 即 评估 
其 在 最 佳 情 况 下 的 有 效 性 (Singal，Higgins，and Waljee 2014) 。 
只 有 在 I 期 与 II 期 试验 完成 后 ， 新 的 药物 才 被 允许 投入 大 规模 的 随机 对 
照 实验 中 。 虽 然 用 于 开发 新 药 的 分 阶段 实验 的 确切 结构 可 能 不 适合 
来 进行 社会 研究 ， 但 当面 临 不 确定 性 时 ， 研 究 人 员 可 以 开展 针对 安全 
性 和 和 有效 性 的 小 规模 研究 。 壁 如 ， 在 “Encore” 项 目 中 ， 你 可 以 想象 
研究 人 员 从 来 自 更 讲究 法 治 的 国家 的 参与 者 开始 研究 。 


总 之 ， 这 4 种 方法 ， 即 最 低 风 险 标准 、 效 果 分 析 、 道 德 反 应 调查 以 
及 分 阶段 实验 ， 即 使 在 面 对 不 确定 性 的 情况 下 ， 都 可 以 帮助 你 以 合理 
的 方式 进行 研究 。 不 确定 性 并 不 一 定 导致 无 所 作为 。 


6.7 实用 技巧 


除了 高 尚 的 道德 原则 以 外 ， 研 究 道德 伦理 还 存在 实际 操作 问题 。 


除了 本 章 描 述 的 道德 原则 与 道德 框 膝 之 外 ， 我 还 想 根 据 我 在 数字 
时 代 推 动 、 审 查 和 讨论 的 社会 研究 中 的 个 人 经 验 ， 提 供 三 条 实用 技 
I: 机 构 审查 委员 会 是 底线 ， 不 是 上 线 ; 换 位 思考 ; 将 研究 伦理 视 作 
连续 的 而 非 离散 的 过 程 。 


6.7.1 机构 审查 委员 会 是 底线 ， 不 是 上 线 


一 方面 ， 许 多 研究 人 员 似 乎 与 机 构 审查 委员 会 持 相 反 的 观点 ; 另 
一 方面 ， 他 们 认为 机 构 审查 委员 会 就 是 装模作样 的 官僚 机 构 。 然 而 ， 
与 此 同时 ， 他 们 也 认为 它 是 伦理 问题 决策 的 最 终 仲 裁 者 。 也 就 是 说 ， 
大 多 数 研 究 人 员 似 乎 认为 一 旦 机 构 审 查 委 员 会 通过 了 审查 ， 那 这 样 做 
就 没 问 题 。 如 果 我 们 承认 机 构 审 查 委员 会 目前 存在 的 非常 真实 的 局 限 
性 ， 并 且 很 多 人 也 这 样 认 为 (Schrag 2010, 2011; Hoonaard 2011; 
Klitzman 2015; King and Sands 2015; Schneider 2015) , BAR 
们 作为 研究 人 员 必 须 为 研究 道德 承担 额外 的 贡 任 。 机 构 审查 委员 会 是 
底线 ， 不 是 上 线 ， 这 个 想法 有 两 个 主要 含义 。 


首先 ， 机 构 审查 委员 会 是 底线 意味 着 ， 如 果 你 在 再 要 机 构 审查 委 
员 会 监管 的 部 门 工 作 ， 那 么 你 应 该 遵循 这 些 规定 。 这 似乎 是 显然 的 ， 
但 是 我 注意 到 有 些 人 似乎 希望 能 够 避 开 机 构 审查 委员 会 。 事 实 上 ， 如 
果 你 在 伦理 上 不 确定 的 领域 工作 ， 那 么 机 构 审查 委员 会 可 以 成 为 一 个 
强大 的 盟友 。 如 果 你 遵循 他 们 的 原则 ， 即 使 在 你 的 研究 出 了 问题 时 ， 


他 们 也 应 该 支持 你 (King and Sands 2015) 。 如 果 你 不 遵守 规则 ， 可 
能 就 要 在 非常 困难 的 情况 下 自行 解决 。 


其 次 ， 机 构 审 查 委 员 会 不 是 上 线 意味 着 ， 只 填写 表格 并 遵守 规则 
古 不 够 的 。 在 许多 情况 下 ， 你 作为 研究 人 员 ， 应 该 是 最 了 解 如 何 遵 守 
道德 规范 的 人 。 最 终 ， 作 为 研究 人 员 ， 道 德 贡 任 在 于 你 ， 你 的 名 字 会 
被 写 在 文献 上 。 


确保 你 将 机 构 审查 委员 会 作为 底线 而 不 是 上 线 的 一 种 办 法 是 在 论 
文中 加 入 道德 附录 。 事 实 上， 你 可 以 在 研究 开始 之 前 就 起 草 道 德 附 
录 ， 以 便 强 过 自己 考虑 如 何 同 同事 和 公众 解释 你 的 工作 。 如 果 你 在 起 
草 道德 附录 时 发 现 自己 感到 不 适 ， 那 么 你 的 研究 可 能 未 达到 适当 的 伦 
理 平 衡 。 除 了 帮助 你 判断 工作 外 ， 公 布道 德 附录 还 有 助 于 研究 界 讨 论 
伦理 问题 ， 并 根据 真实 实证 研究 中 的 实例 建立 适当 的 规范 。 表 6. 3 罗列 
了 我 认为 对 伦理 研究 有 良好 讨论 价值 的 实证 研究 论文 。 我 并 不 同意 这 
些 论文 作者 在 讨论 中 提出 的 所 有 声明 ， 但 是 他 们 都 是 卡特 (Carter 
1996) 定义 下 的 完整 性 研究 人 员 的 例子 : 在 每 个 例子 中 ，(1) 研究 人 
员 都 决定 出 他 们 认为 是 对 的 和 错 的 事情 ; (2) 他 们 根据 自己 的 决定 采 
取 行 动 ， 即 使 是 在 个 人 成 本 方面 ; 〈3) 他 们 公开 表示 的 行为 是 基于 对 
情境 的 道德 分 析 的 。 

表 6.3 关于 伦理 引发 有 趣 讨 论 的 论文 


未 经 同意 的 实地 调查 
避免 情境 伤害 


van de Rijt et al. (2014) 


发 展 中 国家 的 实地 调查 
敏感 话题 的 研究 
复杂 的 同意 议题 


对 可 能 造成 伤害 的 补救 

未 经 同意 的 研究 

在 风险 难以 评估 的 情况 下 进行 风险 收益 权衡 
社会 影响 的 研究 

使 用 泄露 的 数据 文件 


Paluck and Green (2009) 


Burnett and Feamster (2015) 


Chaabane et al. (2014) 


Jakobsson and Ratkiewicz 


经 同意 的 实地 调查 
(2006) E 


Soeller et al. (2016) 


6.7.2 换 位 思考 


研究 人 员 通 常 非常 关注 其 工作 的 科学 目标 ， 他 们 只 能 通过 这 个 角 
度 看 到 世界 。 这 样 的 短视 可 能 会 造成 伦理 上 的 错误 判断 。 因 此 ， 当 你 
思考 你 的 研究 时 ， 试 想 一 下 ， 你 的 参与 者 、 利 益 相关 者 甚至 是 记者 会 
对 研究 做 出 什么 样 的 反应 。 这 种 换 位 思考 与 你 试想 在 他 们 位 置 的 感受 
是 不 同 的 。 相 反 ， 你 试图 想象 其 他 人 会 如 何 感 受 ， 这 个 过 程 可 能 引发 
同 理 心 (或 者 叫 换 位 思考 ) (Batson, Early, and Salvarani 
1997) 。 从 这 些 不 同 的 角度 思考 你 的 工作 ， 可 以 帮助 你 面 对 问 题 并 让 
你 的 工作 具备 更 好 的 道德 平衡 。 


此 外 ， 当 从 别人 的 角度 想象 你 的 工作 时 ， 你 应 该 期 望 他 们 可 能 注 
意 到 东 些 具体 的 、 粳 糕 的 情况 。 艾 如 ， 为 了 回应 情绪 感染 项 目 ， 一 些 


批评 家 专注 于 那些 可 能 造成 目 杀 的 可 能 性 ， 这 是 一 种 低 概率 但 是 很 极 
端的 糟糕 情况 。 一 旦 人 们 的 情绪 受到 刺激 而 关注 最 坏 的 情况 ， 他 们 可 
能 会 完全 放弃 这 种 粳 料 情况 之 外 的 可 能 性 (Sunstein 2002) 。 然 而 ， 
人 们 可 能 在 情绪 上 做 出 反应 的 事实 并 不 意味 着 你 应 该 将 他 们 视 为 不 知 
情 、 非 理性 或 是 思 缀 的 。 我 们 都 应 该 谦逊 地 意识 到 ， 我 们 之 中 没有 一 
个 人 拥有 完美 的 道德 观 。 


6.7.3 将 研究 伦理 视 作 连续 的 而 非 离 获 的 过 程 


数字 时 代 社 会 研究 的 伦理 争议 经 常 是 二 元 (对 与 错 ) N. in, 
情绪 感染 项 目 是 一 个 要 么 道德 要 么 不 道德 的 项 目 。 这 种 二 元 思维 使 讨 
论 变 得 极端 ， 阻 碍 了 开发 共 译 规范 的 努力 ， 使 种 想 懒 懈 。 研 究 被 打上 
了 “道德 ”的 标签 ， 这 使 研究 人 员 免 除了 更 加 道德 地 行事 的 贡 任 。 我 
所 见 过 的 涉及 研究 伦理 的 最 有 成 效 的 对 话 超越 了 这 种 二 元 思维 ， 成 为 
关于 研究 伦理 的 一 个 连续 的 概念 。 


研究 伦理 二 元 概念 的 一 个 主要 实际 问题 是 它 会 使 讨论 变 得 仿 激 。 
把 情绪 感染 项 目 称 为 “不 道德 的 ”， 会 以 一 种 无 荔 的 方式 将 它 与 真正 
的 暴行 混为一谈 。 相 反 ， 更 具体 地 讨论 研究 中 遇 到 的 问题 会 更 有 帮助 
并 且 更 恰当 。 摆 脱 二 元 思维 和 偶 激 的 语言 并 不 代表 我 们 要 用 模棱两可 
的 语言 隐藏 不 道德 的 行为 。 相 反 ， 我 认为 ， 连 续 的 道德 概念 将 带 来 更 
加 谨慎 和 精确 的 语言 。 此 外 ， 研 究 伦 理 的 连续 概念 可 以 厘清 这 样 一 个 
概念 : 每 个 人 ， 甚 至 那些 正在 从 事 “ 道 德 的 ”工作 的 研究 人 员 ， 都 应 
该 努力 在 其 工作 中 创造 更 好 的 道德 平衡 。 


MAA A ET EU Y AE MORADA 
E AS 
复杂 的 ， 任 何 一 个 人 都 不 应 该 对 目 己 判断 正确 行为 的 能 力 过 于 自信 。 


6.8 结论 


数字 时 代 的 社会 研究 引发 了 新 的 伦理 问题 ， 但 这 些 问 题 并 非 不 可 
解决 。 作 为 一 个 社 群 ， 如 果 我 们 可 以 制定 由 研究 人 员 和 公众 文 持 的 共 
同道 德 准则 和 标准 ， 那 么 就 能 以 对 社会 负责 任 和 有 荔 的 方式 利用 数字 
时 代 的 能 力 。 本 章 表 达 了 我 试图 将 我 们 推 癌 这 个 方 同 的 想法 ， 并 且 我 
认为 ， 关 键 是 研究 人 员 应 该 采取 基于 原则 的 思维 方式 ， 同 时 继续 遵守 
适当 的 规则 。 


在 6.2 市 中 ， 我 插 述 了 引起 道德 争议 的 三 个 数字 时 代 研 究 项 目 。 接 
下 来 ， 在 6. 3 节 中 ， 我 描述 了 数字 时 代 社 会 研究 中 伦理 不 确定 性 的 根本 
原因 : 研究 人 员 在 未 经 参与 者 同意 甚至 在 其 没有 意识 到 的 情况 下 对 人 
们 进行 观察 和 实验 的 能 力 在 迅速 增强 。 这 些 能 力 的 变化 速度 远 超 我 们 
的 规范 、 规 则 和 法 律 的 修订 速度 。 再 者 ， 在 6. 4 下 中 ， 我 描述 了 四 个 可 
以 指导 你 思想 的 既 有 原则 : 对 人 的 尊重 原则 、 有 利 化 原则 、 公 正 原 则 
和 对 法 律 和 公共 利益 的 尊重 原则 。 在 6. 5 节 中 ， 我 归纳 了 两 种 广泛 的 道 
德 框架 ， 结 果 主 义 与 义务 论 ， 这 可 以 帮助 你 解决 你 可 能 面临 的 最 深刻 
的 挑战 之 一 : 何 时 你 适合 采取 伦理 上 有 问题 的 手段 来 达到 符合 道德 标 
准 的 目的 。 这 些 原则 和 道德 框架 将 使 你 超越 现 有 法 规 所 允许 的 范围 去 
看 问题 ， 并 提高 你 向 其 他 研究 人 员 和 公众 表达 你 的 判断 的 能 


基于 这 样 的 背景 ， 在 6. 6 节 中 ， 我 讨论 了 数字 时 代 研 究 人 员 面 临 的 
四 个 特别 的 挑战 : 知情 同意 (6. 6. 1 小 节 ) 、 理 解 与 管理 信息 化 风险 
(6. 6.2 小 节 ) 、 隐 私 权 (6. 6. 3 小节 ) ， 以 及 面 对 不 确定 性 做 出 道德 
决策 (6. 6. 4 小 节 ) 。 最 后 ， 在 6.7 节 中 ， 我 归纳 了 三 项 实用 技巧 ， 以 
应 对 在 不 稳定 的 道德 领域 工作 的 情况 。 


在 整体 范围 方面 ， 本 章 集 中 于 从 独立 研究 人 员 的 角度 寻求 可 概 丘 
性 的 知识 。 因 此 ， 它 产生 了 关于 改进 研究 伦理 监督 体系 的 重要 问题 、 
关于 管理 公司 搜集 和 使 用 数据 的 问题 ， 以 及 对 政府 大 规模 监测 的 质 
疑 。 这 些 问 题 显然 是 复杂 和 困难 的 ， 但 我 希望 研究 伦理 的 一 些 观点 对 
这 些 其 他 背景 下 的 研究 有 所 神 益 。 


历史 附录 


该 历史 附录 简要 回顾 了 美国 研究 伦理 方面 的 历史 。 


任何 关于 研究 伦理 的 讨论 都 需要 承认 ， 在 过 去 ， 某 些 研究 人 员 以 
科学 的 名 义 做 了 可 怕 的 事情 。 这 其 中 最 糟糕 的 就 是 塔 斯 基 吉 梅 毒 实验 
( 表 6. 4) 。1932 年 ， 来 自 美国 公共 卫生 局 的 研究 人 员 在 一 项 研究 中 招 
募 了 约 400 名 感染 梅毒 的 黑人 男性 ， 以 监测 该 疾病 的 影响 。 这 些 男性 来 
自 亚 拉巴 马 州 的 塔 斯 基 吉 。 从 一 开始 ， 这 项 研究 就 是 非 治 疗 性 的 ， 它 
的 目的 仅仅 是 记录 黑人 男性 的 疾病 史 。 参 与 者 被 隐瞒 了 人 研究 的 性 质 ， 
他 们 被 告知 这 是 一 项 败血症 研究 ， 并 且 被 提供 了 虚假 的 和 无 效 的 治 
疗 ， 而 梅毒 本 身 是 一 种 致命 疾病 。 随 着 研究 的 深入 ， 人 们 开发 出 了 安 
全 有 效 的 梅毒 治疗 方法 ， 但 该 实验 的 研究 人 员 积 极 干预 以 防止 参与 者 
在 其 他 地 方 接 受 治 疗 。 例 如 ， 在 第 三 次 世界 大 战 期 间 ， 该 研究 小 组 在 
研究 中 确保 所 有 人 在 研究 期 间 缓 服 兵役 ， 以 防止 这 些 男 性 进入 部 队 时 
获得 治疗 。 研 究 人 员 40 年 中 持续 欺骗 参与 者 并 拒绝 治疗 他 们 。 

表 6.4 塔 斯 基 吉 梅 毒 实验 的 部 分 时 间 线 


2) 400 名 感染 梅毒 的 男性 被 招募 至 研究 中 ， 他 们 并 未 被 告知 研究 
的 真实 目的 


美国 公共 卫生 局 向 该 地 区 派 遗 了 移动 治疗 单位 ， 但 拒绝 治疗 研究 
中 的 男性 


为 防止 这 些 受 试 男性 在 研究 中 接受 其 他 地 方 的 治疗 ， 公 共 卫 生 局 
在 第 二 次 世界 大 战 期 间 介 入 ， 防 止 他们 服 兵役 


青霉素 开始 成 为 治疗 梅毒 的 广泛 有 效 的 措施 ， 但 这 些 受 试 男性 并 


1937 一 1938 年 


1942 一 1943 年 


20 世纪 50 年 代 


未 接受 治疗 ( Brandt 1978 ) 


美国 公共 卫生 局 召开 对 该 研究 的 伦理 审查 ， 审 查 小 组 建议 继续 进 
行 该 实验 

one 美国 公共 卫生 局 前 雇员 彼得 - 巴克 斯 顿 (Peter Buxtun ) 透露 了 该 
实验 ， 并 在 媒体 上 公布 这 一 消息 


美国 参议 院 召 开 有 关 人 类 实验 的 听证 会 ， 包 括 塔 斯 基 吉 梅 毒 实验 
美国 政府 停止 该 实验 并 责令 对 幸存 者 进行 治疗 
美国 总 统 比尔 . 克林顿 公开 塔 斯 基 吉 梅 毒 实验 并 进行 官方 道 革 


塔 斯 基 吉 梅 毒 实验 是 在 当时 美国 南部 地 区 常见 的 种 族 主义 和 极端 
不 平等 背景 下 进行 的 。 但 是 ， 在 40 年 的 历史 中 ， 这 项 研究 涉及 数 十 名 
黑人 受 试 者 和 白人 研究 人 员 。 除 了 直接 参与 的 研究 人 员 以 外 ， 还 有 很 
多 人 肯定 在 已 发 表 的 医学 文献 中 阅读 过 相关 的 15 篇 研究 报告 中 的 某 一 
fis (Heller 1972) 。 在 20 世 纪 60 年 代 中 期 ， 也 就 是 研究 开始 大 约 30 年 
后 ， 一 位 名 叫 彼得 .巴克 斯 顿 的 美国 公共 卫生 局 雇员 开始 在 其 内 部 推 
动 结束 这 一 研究 ， 他 认为 这 种 研究 在 伦理 上 令 人 无 法 接受 。 作 为 对 巴 
克 斯 顿 的 回应 ， 美 国 公共 卫生 局 在 1969 年 召集 了 一 个 小 组 ， 对 该 研究 
进行 了 完整 的 伦理 审查 。 令 人 震惊 的 是 ， 伦 理 审查 小 组 认为 研究 人 员 
应 该 继续 拒绝 给 受 感染 的 男性 提供 治疗 。 在 评议 的 过 程 中 ， 专 家 组 的 
一 位 成 员 甚 至 表示 : “你 永远 不 会 再 有 这 样 研究 的 机 会 ， 好 好 利用 它 


IB. ” (Brandt 1978) 。 这 个 绝 大 多 数 由 博士 组 成 的 白人 专家 组 认为 
应 该 获取 某 种 形式 的 知情 同意 。 但 是 该 专家 组 也 认为 ， 由 于 受 试 者 的 
年 龄 和 低 教 育 程度 问题 ， 他 们 自己 无 法 提供 知情 同意 。 因 此 ， 专 家 组 
建议 研究 人 员 从 当地 医疗 官员 处 获得 “代理 人 知情 同意 ”。 所 以 ， 经 
过 全 面 的 伦理 审查 ， 继 续 治 疗 的 建议 被 驶 回 。 最 终 ， 巴 克 斯 顿 将 这 件 
告诉 了 一 位 记者 。1972 年 ， 简 ， 海 勒 (Jean Heller) 撰写 了 一 系列 
报道 文章 ， 向 全 世界 揭示 了 这 项 研究 。 在 广泛 的 公众 愤怒 情绪 之 下 ， 
这 项 研究 才 最 终结 束 ， 那 些 幸 存 下 来 的 男性 才 得 到 治疗 。 


该 研究 的 受害 者 并 不 只 是 这 些 男 性 ， 还 包括 他 们 的 家 寿 : 至 少 22 
名 妻子 、17 名 儿女 以 及 2 名 孙子 ， 他 们 均 可 能 由 于 没有 受到 治疗 而 感染 
梅毒 (Yoon 1997) 。 更 进一步 ， 这 项 研究 造成 的 伤害 在 其 结束 后 也 持 
续 了 很 长 时 间 。 该 研究 在 法 理 上 减弱 了 非 毅 美国 人 对 医学 界 的 信任 ， 
这 种 信任 的 月 塌 可 能 导致 非 疹 美国 人 拒绝 医疗 护理 而 损害 他 们 的 健康 
(Alsan and Wanamaker 2016) 。 此 外 ， 缺 乏 信任 阻碍 了 在 20 世 纪 80 
年 代 和 90 年 代 治 疗 艾滋 病 的 努力 〈Jones 1993， 第 14 章 ) 。 


尽管 我 们 今天 很 难 想象 会 有 如 此 可 怕 的 研究 发 生 ， 但 我 认为 塔 斯 
基 吉 梅毒 实验 对 于 在 数字 时 代 进 行 社会 研究 的 人 有 三 个 重要 的 经 验 教 
训 。 首 先 ， 它 提醒 我 们 ， 有 些 研究 根本 不 应 该 发 生 。 其 次 ， 它 回 我 们 
表明 ， 有 些 研究 可 能 不 只 对 参与 者 造成 伤害 ， 还 会 在 研究 结束 后 对 他 
们 的 家 庭 以 及 整个 社 群 造成 长 期 伤害 。 最 后 ， 它 告诉 我 们 ， 某 些 研 究 
人 员 也 可 能 做 出 很 可 怕 的 道德 决定 。 事 实 上 ， 我 认为 今天 研究 人 员 应 
该 感到 一 些 轴 惧 ， 因 为 参与 这 项 研究 的 很 多 人 在 如 此 长 的 时 间 内 做 出 
并 坚持 了 如 此 糟糕 的 决定 。 并 且 ， 不 笠 的 是 ， 塔 斯 基 吉 的 例子 并 不 是 
唯一 的 ， 那 个 时 代 还 存在 着 许多 在 社会 和 医疗 研究 中 相似 的 有 问题 的 
事例 (Katz, Capron, and Glass 1972; Emanuel et al. 2008) 。 


1974 年 ， 为 了 回应 塔 斯 基 吉 梅 毒 实验 及 其 研究 人 员 的 伦理 过 失 ， 
美国 国会 成 立 了 生物 医学 及 行为 研究 人 体 受 试 者 保护 全 国 委 员 会 


(National Commission for the Protection of Human Subjects of 

Biomedical and Behavioral Research) ， 并 负责 制定 涉及 人 类 受 试 
者 研究 的 伦理 准则 。 在 贝尔 蒙 会 议 中心 召 开会 议 的 4 年 后 ， 该 小 组 编写 
了 《贝尔 蒙 报告 》， 该 报告 对 生物 伦理 学 和 日 党 研究 实践 均 产 生 了 巨 
大 影响 。 


《贝尔 蒙 报告 》 由 三 部 分 组 成 。 第 一 部 分 ， 关 于 实践 与 研究 之 间 
的 界限 ， 该 报告 前 明了 其 权限 范围 。 特 别 是 ， 它 主张 区 分 获取 一 般 化 
知识 的 研究 与 包括 日 常 措施 和 行为 在 内 的 实践 。 此 外 ， 第 一 部 分 讲 到 
《贝尔 蒙 报 告 》 的 道德 原则 仪 适用 于 研究 。 有 人 认为 ， 这 种 研究 和 实 
践 之 间 的 区 分 是 《贝尔 蒙 报 告 》 不 适合 数字 时 代 社 会 研究 的 一 个 原因 
(Metcalf and Crawford 2016; boyd 2016) . 


《贝尔 蒙 报告 》 的 第 二 部 分 和 第 三 部 分 提出 了 三 个 道德 原则 ， 即 
对 人 的 草 重 原则 、 有 利 化 原则 和 公正 原则 ， 并 描述 了 这 些 原则 要 如 何 
应 用 于 研究 实践 中 。 这 些 原则 的 细节 我 已 经 在 本 章 的 正文 部 分 讲述 
T: 


《贝尔 蒙 报告 》 设 定 了 广泛 的 目标 ， 但 它 不 是 一 个 可 以 轻松 用 于 
监管 日 常 活 动 的 文件 。 因 此 ， 美 国政 府 制定 了 一 套 俗 称 为 《通则 》 的 
法 规 (Porter and Koski 2008) 。 这 些 规定 描述 了 审查 、 批 准 和 监督 
研究 的 过 程 由 机 构 审查 委员 会 负责 执行 。 要 理解 《贝尔 蒙 报 告 》 和 
《通则 》 之 间 的 区 别 ， 请 考虑 各 方 如 何 讨论 知情 同意 : «DUR FIR 
告 》 摘 述 了 知情 同意 的 哲学 原因 和 代表 真正 意义 上 知情 同意 的 广泛 特 
征 ， 而 《通则 》 列 出 了 知情 同意 的 8 个 必要 条 件 和 6 个 可 选 要 素 。 根 据 
法 律 ，《 通 则 》 管 辖 几 乎 所 有 接受 美国 政府 资助 的 研究 项 目 。 此 外 ， 
许多 从 美国 政府 获得 资助 的 机 构 通 常 将 《通则 》 应 用 于 该 机 构 进 行 的 
所 有 研究 ， 而 不 考虑 资金 来 源 。 但 《通则 》 并 不 自动 适用 于 没有 从 美 
国政 府 获得 研究 经 费 的 公司 。 


RUAIL EMA A MADE CUUR SRA) AIA te ot 
完 的 广泛 目标 ， 但 《通则 》 以 及 与 机 构 审 碍 委员 会 合作 的 过 程 普 过 令 
人 感到 烦恼 (Schrag 2010, 2011; Hoonaard 2011; Klitzman 2015; 
King and Sands 2015; Schneider 2015) 。 需 要 摘 清 楚 的 是 ， 那 些 批 
评 机 构 审查 委员 会 的 人 并 不 反对 道德 规范 。 相 反 ， 他 们 认为 目前 的 体 
系 没 有 达到 适当 的 平衡 ， 或 者 可 以 通过 其 他 方法 更 好 地 实现 其 目标 。 
无 论 如 何 ， 我 将 会 把 机 构 审查 委员 会 视 作 给 定 条 件 。 如 采 你 需要 遵守 
机 构 审查 委员 会 的 规则 ， 那 么 你 就 应 该 这 样 做。 尽管 如 此 ， 我 仍旧 茧 
励 你 在 考虑 研究 伦理 时 也 采取 基于 原则 的 方法 。 


这 一 背景 非常 简要 地 总 结 了 我 们 如 何在 美国 遵守 机 构 审查 委员 会 
基于 规则 的 制度 。 当 我 们 今天 考虑 《贝尔 莹 报告 》 和 《通则 》 时 ， 应 
该 记 住 它 们 是 在 不 同 的 时 代 被 创造 的 ， 并 且 对 当时 产生 的 问题 ， 它 们 
做 出 了 相当 明确 的 回应 ， 特 别 是 对 “二 战 ” 期 间 和 之 后 的 医学 伦理 学 
做 出 了 回应 (Beauchamp 2011) 。 


除了 医学 和 行为 科学 家 为 创造 道德 规范 所 做 的 努力 之 外 ， 计 算 机 
科学 家 也 做 出 了 一 些 规模 较 小 且 知 名 度 不 大 的 努力 。 事 实 上 ， 第 一 批 
关注 数字 时 代 研 究 所 融 来 的 伦理 挑战 的 研究 人 员 并 不 是 社会 科学 家 ， 
而 是 计算 机 科学 家 ， 特 别 是 在 计算 机 安全 领域 的 研究 人 员 。 在 20 世 纪 
90 年 代 和 21 世 纪 初 ， 计 算 机 安全 研究 人 员 进 行 了 一 系列 有 道德 的 研 
究 ， 这 些 研 究 涉 及 接管 僵尸 网 络 和 侵入 成 干 上 万 台 弱 加 密 的 计算 机 
(Bailey, Dittrich, and Kenneally 2013; Dittrich, Carpenter, 
and Karir 2015) 。 针 对 这 些 研 究 ， 美 国政 府 部 门 ， 特 别 是 美国 国土 
安全 部 设立 了 一 个 蓝 带 委员 会 ， 为 涉及 信息 和 通信 技术 的 研究 撰写 指 
性 性 道德 框架 。 其 成 果 就 是 《 门 罗 报告 》 (Dittrich, Kenneally, 
and others 2011) 。 尽 管 计算 机 安全 研究 人 员 的 担忧 与 社会 研究 人 员 
的 担忧 不 尽 相 同 ， 但 《 门 罗 报告 》 为 社会 研究 人 员 提 供 了 三 个 重要 的 
指导 。 


首先 ，《 门 罗 报 告 》 再 次 重申 了 《贝尔 莹 报告 》 中 涉及 的 三 项 基 
本 原则 ， 即 对 人 的 草 重 原则 、 有 利 化 原则 以 及 公正 原则 ， 并 附带 了 一 
项 新 的 原则 :对 法 律 和 公共 利益 的 碍 重 原则 。 我 在 本 章 正 文中 描述 了 
第 四 项 原则 以 及 它 如 何 被 应 用 于 社会 研究 〈6. 4. 4 小 节 ) 。 


其 次 ，《 门 罗 报 告 》 呼 吁 研究 人 员 超 越 《 贝 尔 莹 报告》 中 “涉及 
人 体 科 学 的 研究 ”的 狭隘 定义 ， 转 而 采用 “有 具有 潜在 人 号 伤害 的 研 
究 ” 这 一 更 普遍 的 概念 。“Encore” 项 目 很 好 地 说 明了 《贝尔 蒙 报 
告 》 定 义 范 围 的 局 限 性 。 普 林 斯 顿 大 学 和 乔治 亚 理 工学 院 的 机 构 审 查 
委员 会 裁定 “Encore” 项 目 不 是 “涉及 人 体 科 学 的 研究 ”， 因 此 不 受 
《通则 》 的 监管 。 然 而 ，“Encore” 项 目 显然 具有 人 身 伤害 的 潜力 ; 
在 最 极端 的 情况 下 ，“Encore” 项 目 可 能 会 导致 无 齐 的 人 被 专制 政府 
监 葵 。 基 于 原则 的 方法 意味 着 ， 即 使 机 构 审 碍 委员 会 同意 ， 研 究 人 员 
也 不 应 该 隐藏 在 狭隘 的 法 律 定 义 之 后 。 相 反 ， 他 们 应 该 采用 “具有 洪 
在 人 里 伤害 的 研究 ”这 一 更 普遍 的 概念 。 


第 三 ，《 门 罗 报 告 》 呼 吁 研究 人 员 扩 大 在 应 用 《贝尔 莹 报告 》 原 
则 时 考虑 的 相关 利益 方 。 随 着 研究 已 经 从 单独 的 生活 领域 转移 到 更 加 
深入 日 常 活动 的 领域 ， 伦 理 考 虑 的 范围 必须 扩展 到 特定 参与 者 之 外 ， 
而 且 应 该 包括 非 参 与 者 和 研究 发 生 的 环境 。 换 言 之 ，《 门 罗 报 告 》 呼 
吁 研究 人 员 扩大 他 们 的 道德 领域 ， 而 不 仅仅 考虑 他 们 的 参与 者 。 


本 历史 附录 提供 了 对 社会 科学 、 医 疗 科 学 以 及 计算 机 科学 研究 伦 
理 的 简要 回顾 。 有 关 医 疗 科 学 研究 伦理 的 处 理 方式 ， 请 参见 伊 曼 努 尔 
等 人 (Emanuel et al. 2008) 或 比 彻 姆 和 奇 尔 德 雷 斯 (Beauchamp 
and Childress 2012) 的 长 篇 著作 。 


